蛋白质组学

BLAST比对

NCBI中Blast可以用来进行序列比对、检验引物特异性
Blast导航主页面主体包括三部分
BLAST Assembled Genomes选择你要对比的物种,点击物种之后即可进入对比页面
Basic BLAST包含5个常用的Blast,每一个都附有简单介绍
Specialized BLAST是一些特殊目的的Blast,如Primer-BLAST、IgBLAST
根据需要做出选择
Blast中常用的程序介绍:
1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。
2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。
3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。
4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。

BLAST程序检测序列和数据库类型


将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库

点击Basic BLAST部分的nucleotide链接到一个新的页面,打开后的页面特征:
大体上包括三个部分
Enter Query Sequence部分可以让我们输入序列,其中的Job Title部分可以为本次工作命一个名字
Choose Search Set部分可以选择要与目的序列比对的物种或序列种类。
其中的Entrez Query可以对比对结果进行适当的限制。
Program Selection部分可以选择本次对比的精确度,种内种间等等。
其次Blast按钮下面有一个“Algorithm parameters”算法参数,可设置参数。
点击Blast后,出现的页面大体上包括四个部分
一.所询问和比对序列的简单信息
1.询问序列的简单信息——名称、描述、分子类型、序列长度
2.所比对数据库的名称、描述和所用程序
二.Graphic Summary——blast结果图形显示
相似度颜色图(黑、蓝、绿、粉红、红,相似度由低到高)
三.Descriptions——blast结果描述区
1.到其他数据库的链接
2.描述以表格的形式呈现(以匹配分值从大到小排序)
(1)Accession下程序比对的序列名称,点击相应的可以进入更为详细的map viewer
(2)Descriptions下是对所比对序列的简单描述
接下来是5个结果数值:
(3)Max score匹配分值,点击可进入第四部分相应序列的blast的详细比对结果
(4)Total score总体分值
(5)Query coverage覆盖率
(6)E value——E(Expect)值,表示随机匹配的可能性。
E值越大,随机匹配的可能性也越大。
E值接近零或为零时,具本上就是完全匹配了。
(7)Max ident——匹配一致性,即匹配上的碱基数占总序列长的百分数。
(8)Links——到其他数据库的链接。
四.各序列blast的详细比对结果

评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。
数据库中不同序列比对的详细结果,每一个结果大体上包括3部分
1.所比对序列的名称、简单描述、长度。到其他数据库的链接。
2.比对结果的5个数值:
(1)score打分矩阵计算出来的值,由搜索算法决定的,值越大说明询问序列跟目标序列匹配程度越大
(2)Expect是输入序列被随机搜索出来的概率,该值越小越好。表示随机匹配的可能性,E值越大,随机匹配的可能性也越大。E值接近零或为零时,具本上就是完全匹配了。
(3)Identities是相似程度,即输入序列和搜索到序列的匹配率
(4)Gaps就是空白,即比对序列只有一条链上有碱基
(5)strand=plus/minus即询问序列和数据库里面序列的互补链匹配
3.输入序列和库中对比到的序列每个碱基的详细对比







(0)

热评文章

发表评论