蛋白质组学

蛋白质组学在基础和应用生物学中的应用

在过去的一年里,随着双向电泳、质谱以及不同研究程序核心技术的改进,蛋白质组学保持着持续快速的进步。

完全注释的蛋白质组学数据库现在在一些领域已经出现了,并为系统研究提供了一个平台,在临床应用诸如心血管和肿瘤学中尤其有发展前途。大规模定量研究,在功能和敏感性上能与基因表达所达到的程度相媲美,因而在蛋白质水平上的研究也正变为现实。

简介

如果90年代是基因组的十年,新世纪的头十年将成为蛋白质组学的十年。蛋白质组学技术生成的定量表达数据第一次可以在规模和敏感性上与基因水平相媲美。

这个进展对于我们理解人类健康和疾病的细胞组成结构以及对药物、农业生物技术等有着重要的意义。确实,蛋白质组学业已在大范围应用中产生了重要发现。这篇文章综述了蛋白质组研究中的新概念、革新技术以及生物应用。

概念:结构对量化调节蛋白质组学

蛋白质组学的最终目标不仅仅是将健康和疾病状态下细胞表达的蛋白质分类。最终目标是阐明细胞生命赖以进行的代谢、信号传导和调控网络的组织和动力学。另外,蛋白质组学还寻求理解这些网络如何在疾病中失去功能以及如何通过干预诸如药物和基因操作操纵它们的功能。

这些是模糊不清的目标,在它们能够充分实现之前需要敏感性增强的技术和新的概念,但是对调节网络作图和细胞状态诊断的任务在不断进展。

在微生物中,VanBogelen等[1]已经识别了特殊细胞状态的蛋白质组信号,如分泌功能障碍和特殊磷来源的使用,并且目前正在结合基因组和蛋白质组方法试图作出完全的调节网络[2]。

然而,大多数蛋白质组研究都指向具体生理状态下蛋白质表达和功能等更近期的目标。这里,两个对立但是互补的策略已经出现了。一个是“表达”或者“定量调节”蛋白质组学,用来监控一个细胞或组织里大数量蛋白质的表达以及定量观察在不同环境下,诸如药物的存在或者在疾病组织里表达方式是如何改变的[3]。

这使得它可能识别疾病特异性蛋白质、药物靶标和药物毒性与效力的标记物,以及通过识别表达进行协调改变的蛋白质。这是目前最广泛应用和有效的蛋白质组学模型,现在还主要依赖于双向电泳(2DE)。

第二个策略被称为“细胞图谱”或者“结构”蛋白质组学[4]。这里,近期目标是识别蛋白质的结构,尤其是识别与其它蛋白质相互作用后形成复合体的蛋白质结构。通过记录蛋白质的物理相互作用,尽管没有定量调节蛋白质组学的所集中的幅度,这个策略可能对特别通路的具体研究很有效。

尽管双杂交以及相关的分析[5]对特异蛋白质-蛋白质相互作用的识别是重要的,结构蛋白质组学的最重要的技术是质谱(MS)。

技术:2DE和MS的改进

定量调节和结构蛋白质组学的区分是有用的,然而必须强调大多蛋白质组项目结合了两种方法并同时依赖2DE和MS。在过去的几年里这些核心技术已经有了显著的进展。

通过建立在zwitterionic去污剂[6]和有机溶剂[7]基础上的样品制备的持续进展,令人烦恼的用2DE分离高度憎水的膜蛋白质的问题也有了逐渐的进展,但是仍然是一个重要和未解决的问题。

从一个组织获得单一细胞类型样品的问题可以通过使用一个激光捕获显微切割系统来解决,一个组织样品附着在一个胶片上,然后同样目的的细胞用一个激光束脱离下来[8]。

蛋白质组学中MS的使用在功能和多样性方面已经有了一些显著改进而且继续演进。

一些研究组已经引入了新的蛋白质标记方法学改进了MS的功能和敏感性[9,10]。Aebersold和合作者[10]已经发展了一个用同位素编码的亲和标签(ICAT)标记肽的方法,它不仅支持复杂肽混合物的增强分析,也允许在蛋白质表达水平对差异进行精确的定量,这是MS为基础的蛋白质组学以前所没有的功能。

MS与一个软件工具FindMod的配对也增强了该方法识别转录后的修饰能力[11]。

定性蛋白质复合体的技术也被引进,包括基于液相色谱/串联MS[12]的系统以及发展一个新的串联亲和纯化(TAP)标签以从细胞样品中快速纯化复合物[13]。其它样品处理方法的进展近来允许对分泌囊中的肽用MS直接进行分析,并可望用同样的技术对其它细胞器进行分析[14]。

当然,通过结合2DE和MS为基础的方法蛋白质组学能获得最低点的功能。一个代表性的结合例子是Hochstrasser研究组[15]所发展的系统,整个2DE凝胶进行原位消化,电转移到膜上并直接用MS扫描,生成注释的2D图谱。这样的发展在一些专业蛋白质组学公司已经开创,现在可以使得蛋白质组学在与项目本身复杂性相对应的规模上开展起来。

蛋白质组数据库

蛋白质组数据库含有不同细胞状态下获得的2DE注释数据,它是基本的平台,从数据库蛋白质组研究解决具体的生物学和药物学问题。然而值得注意的是目前相对少的大规模数据库已经出现到公共区域里来了。

酵母蛋白质数据库是最好的和建立最久的一个大规模数据库,它的主办者Proteome Inc(Beverly,MA)现在正在构建WormPD[16],这是一个线虫C.elegans的蛋白质组数据库,该线虫的完整基因组已经被测序。

在过去一年里,最重要的数据库发展是Hoffmann-La Roche构建的流感噬血杆菌数据库,包含超过1000个独立的2DE蛋白质点的图谱,其中500多个独立蛋白质已经被识别[17]。

Klose和合作者[18]近来也报道了它们正在发展的小鼠蛋白质组数据库,开始的重点是大脑蛋白质。在人类,Celis等建立的膀胱癌数据库[19]仍然是目前所能获得的最大和注释最好数据库之一,尽管再过几年一定会看到生成大范围的人组织的蛋白质组数据库。

设计解决人和其它生物体具体生物问题的较小蛋白质组数据库的数目现在已经很庞大,超过了此综述所谈的范围。Expasy网站是主要SWISS-2D PAGE蛋白质组数据库和其它资源的主页,含有大量的链接,仍然是探索公共蛋白质组学数据库的最佳平台。

基础生物学

解决基础生物学问题的蛋白质组学项目的数目目前已经很大了并且继续增长。这一部分反映了“蛋白质组学”这个词的广泛用途,不仅包含了大规模生物技术研究,也包括了使用2DE、MS或其它技术系统研究蛋白质的项目。

从蛋白质组学扩展出来,对普通生物学来说是一个最重要的主题是深入探索基因和蛋白质关系的本质。在上述Klose及同伴的小鼠蛋白质组项目中[18],基于蛋白质多样性,几百个小鼠基因被定位到染色体上。

这些研究所呈现的是许多蛋白质修饰与具体的基因关联,于是一个蛋白质应该被认为不是一个而是许多基因的表现型[20]。同样的,一个基因突变会影响许多蛋白质。最终,这种研究会有助于更成熟地理解健康和疾病中基因和细胞功能的关系。

结合免疫层析技术和2DE以及随后的MS仍然是研究某个细胞蛋白质组的某个具体亚系的主要载重马。

无数基础细胞机制的研究正用这个方法进行着。比如,用抗磷酸酪氨酸和抗磷酸色氨酸抗体的免疫印迹被用来从小鼠成纤维细胞中提取超过500个磷酸化的蛋白质,其中至少100个在用血小板衍生的生长因子(PDGF)刺激后进行了磷酸化改变[21]。这些研究揭示了PDGFb受体下游推测信号的新传导途径,并使用到其它信号传导途径。

第二个例子,免疫沉淀被用来从E.coli提取伴娘分子GroEL,与超过300个新翻译的多肽形成复合体,它们随后用2DE进行分离。这个技术能够研究介导蛋白质折叠的GroEL的功能,并是一个如何能够被用来靶向和研究一个具体的细胞成分亚系的典型蛋白质组学技术。

这一部分的最后值得提出的是:蛋白质组学是植物生物学和农业生物技术的新兴领域[23]。植物蛋白质组学研究包括定性个体和系的鉴定、评估群体内部和之间的遗传多变性[23]。

(0)

热评文章

发表评论