蛋白质组学

蛋白质相互作用信息的查询

蛋白质相互作用信息的查询
 
    研究一个基因及其编码的蛋白质时,除了一方面了解它们的功能外,另一方面需研究与此蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清楚地理解其调控机制。下面是与研究蛋白质相互作用相关的数据库应用系统。
    STRING数据库(http://string.embl.de/)是一个搜寻已知蛋白质之间和预测蛋白质之间相互作用的系统,这种相互作用既包括蛋白质之间直接的物理的相互作用,也包括蛋白质之间间接功能的相关性。它除了包含有实验数据、从PubMed摘要中文本挖掘的结果和综合其他数据库数据外,还有利用生物信息学的方法预测的结果。所应用的生物信息学的方法有:染色体临近、基因融合、系统进化谱和基于芯片数据的基因共表达。系统中利用一个打分机制对这些不同方法得来的结果给予一定的权重,最终给出一个综合的得分。
    用户可以利用基因或蛋白质名称、氨基酸序列来查询相关蛋白质相互作用的信息。在查询的过程中,如果相关的蛋白质名称出现在几个不同的物种中,则数据库系统会将这些物种全部显示出来,用户自己再选择感兴趣的蛋白质进行下一步的查询。所得的结果中会包含有与所查询蛋白质相关联的其他蛋白质的信息,并且会显示这种相关性信息来源于哪些方法,同时给出一个综合得分数。当出现好几个相关联的蛋白质时,这些蛋白质将按照所得分数的高低排列。点击相关的蛋白质名称,将会显示出此蛋白质的序列以及在相关的物种中与这条序列同源性高的其他序列。利用结果下面的"Views”栏目中的方法按钮,则可以查看相关方法的具体证据。点击"Summery Network"按钮,则会显示出这些蛋白质之间功能相关的网络。在网络中,用不同的颜色线来表明不同方法得来的结果。这个相互作用网络还可以用不同的格式存盘,这些格式主要是.png、.xml、.txt等。
    InAct数据库(http://www.ebi.ac.uk/intaet/index.html)是欧洲生物信息学研究所建立的一个综合性的蛋白质相互作用的数据库,这个数据库整合了现有的其他数据库的数据,所整合的数据库包括DIP、BIND等公开数据库。这个数据库中蛋白质相互作用数据格式及相互作用的描述采用国际蛋白质数据标准(protein standard initiative,PSl),数据下载的格式是PSIMIXML,使得数据下载后对其进行处理变得非常方便,也很容易利用相关的注释信息连接到其他主要的数据库,如UniProt等。
这个数据库中的数据来源于各种实验,既有小规模的实验结果,又包含高通量的实验数据。数据库的查询可以利用很多种不同的关键词,如基因的名称、GO号、InterPro的编号等。在数据库中,对每一个实验中涉及的内容都有简单的说明,包括采用实验的平台、实验的条件、检测的方法、相关文章PubMed的编号等。相互作用的方式,是指物理的直接的相互作用还是功能的相关性,在查询结果中选择相互作用的蛋白质,点击网页上面的“Graph"按钮,则会搜寻系统中所有与选择的蛋白质相关的相互作用信息动态生成的蛋白质相互作用的网络图。在相互作用的网络中,所选择的蛋白质会以黑体标出。要想包含更多相互作用的网络,可以通过点击网页左边的Graph"Expand"按钮得到。在网页中的右面则有相关蛋白质的功能注释,包括GO功能注释;点击Inter Pro的编号,则在新的窗口中显示Inter Pro数据库中的相关注释。
    DIP数据库(http://dip.doe―mbi.ucla.edu/)是一个查询蛋白质相互作用的系统。它搜集了多个物种的蛋白质相互作用实验数据,而且这些数据是通过人工或计算方法检测过的,因此具有很高的可靠性。这个数据库中既有来源于小规模的实验的数据,也有高通量方法得来的数据。通常,小规模实验的数据具有较高的可信度,因此,在研究蛋白质相互作用预测方法中,可以把这些数据看作为高可信度的核心数据应用于预测方法检测的正集,而高通量的数据则会有较高的假阳性。可以通过不同的方式对数据库进行查询,包括“Node"、“BLAST"、“Motif"和"Article"等,使用者可以依据自己的需求查询相关的信息。
    人类蛋白质参考库(human protein reference database,http://www.hprd.org)是一个人工阅读搜集数据而来的数据库,此数据库里的数据具有很高的可靠性。目前数据库中所注释的蛋白质已超过2万个,有3万多条相互作用的蛋白质数据,此外,还包括一些蛋白质功能域、蛋白质翻译后修饰等方面的信息。每个查询结果中都有相关的文献支持,点击相关的"PubMed"链接就可查看信息来源的文章。此数据库是目前为止与人类基因、蛋白质相关的最全面的文本挖掘数据库。
    数据库中提供了不同工具使用户可以对数据库进行不同的操作,如对数据库进行查询、浏览、比对。“PhosphoMoti f Finder"提供了查询蛋白质中存在的激酶、磷酸酶结合位点(motif)的信息,相关的信息只是从文献中得来,此工具不提供预测的结果。在“Pathways”栏目中,用户可以查看不同的信号转导途径的网络,网络的展现可以是PDF格式或HTML格式。在相关的网络图中,各种分子的相关性都根据文献用不同的颜色进行了注释,这种相关性包括磷酸化作用、诱导的磷酸化作用、诱导的脱磷酸化作用、诱导的泛锟作用(induced dehosphorylation),哪些形成复合体,哪些形成酶的修饰复合体,分子之间的作用形式也有注解,如活化、抑制、刺激等。除此以外,还可以下载各种生物化学途径。
    通过"Browse",可以根据分子分类(moleculeclass)、功能域、Motifs、翻译后浏览(PTMs)和亚细胞定位等查看各种蛋白质的信息。在呈现的结果中,会包含每一种蛋白质的功能域的组成、功能、亚细胞定位、与其他蛋白质相互作用等方面的信息。而对数据库的查询可以利用HPRD ID,RefSeq、OMIM、SWlSSProt或Entrez Gene的Accession Number、蛋白质名称、基因符号等方面的关键词进行,还可以选择基因表达的组织、疾病等关键词查询。
    HiMap(http://www.himap.org)则是研究人类蛋白质相互作用的另一个数据库。这个数据库除了搜集实验验证的蛋白质相互作用外,还收录了利用整合的生物信息学方法预测出来的蛋白质相互作用信息,可以为实验提供一些有用的信息。
    除了上述的相关的蛋白质相互作用的数据库外,http://www.theBioGrid.org作为一个综合搜集蛋白质相互作用的联盟,也是一个整合了的蛋白质相互作用的数据库系统。


(0)

热评文章

发表评论