Nucleic acid/protein sequence alignment
Nucleic acid/protein sequence alignment
2024-3-27|Last edited: 2024-5-28
icon

前言

序列为字符串,表示序列s的第i个字符,是子序列的意思
FASTA格式:第一行,大于号和名称、注释,第二行以后每行60/80字母
存到txt文档,不能用word
 
序列比对最高效的方法是计算机
两两比对,多序列比对
Gene tree就是多序列比对的结果
Match (a, a) 字符匹配 Delete 删除 Replace 替换 Insert 插入
 
相似性:相似百分比
同一性:同一位点完全相同的比例
同源性:指从某个共同祖先经进化来的;同源直系

核酸

嘌呤两个环,相当于嘧啶环加入另一个
A和G很相似,叫“转换”,属于同类,计算机给出评分-1
嘌呤和嘧啶改变,叫“颠换”,跨类别,扣5分(影响大)

工具

FASTA工具:第一个工具包,效率低,现在不用了
BLAST工具:Basic local alignment search tool,常用

多序列比对

对多条序列插入空位,使得插入空位前后的全局对比结果有相同长度
工具使用ClustalX/W

蛋白质结构预测

螺旋,折叠,三级结构是空间结构,四级结构是亚基构成的
预测字典,DSSP,用已知的二级结构对已测定三级结构的蛋白质的各个位置指认出是哪种二级结构
(没看懂)
 

NCBI对比

NCBI - 右侧工具BLAST
notion image
左侧绿色的,两两比对
 
  1. 输入序列(也可以上传文件)
  1. 选择类别,默认核酸
  1. 选择相似度
然后得出预测结果,从整个库中进行比对,找到最有可能的基因
notion image
这里可以进行两两比对:
notion image
 

ClustalX/W软件

把找好的序列(FASTA格式)放到一个txt文件,导入
notion image
完全比对
在大量相似的区域,很有可能是蛋白质相关区域
notion image
 

在线网站比对

好慢(
notion image
输入序列,起个名字,邮箱用机构邮箱,给发到邮箱
免费
 
notion image
多重比对
notion image
完全相同的,有星号
 
Imaging Technology and Surgical ProceduresApplication of Bioinformatics database