蛋白质组学

质谱与蛋白质组学

Current Opinion in Chemical Biology 2000, 4:489-494

蛋白质组学对一个细胞或组织所表达的蛋白质进行的系统分析,而质谱是它的关键性分析工具。在过去的两年中,标准蛋白质组技术中的进展增进了更高水平自动化和敏感性的蛋白质识别技术。另外,新的技术促成了鉴定蛋白质功能相关特性的里程碑性的进展,包括它们的定量和在蛋白质复合物中复杂情况。

缩写
2DE two-dimensional gel electrophoresis双向凝胶电泳
CID collision-induced dissociation碰撞诱导的解离
ESI electrospray ionization电喷雾离子化
FT-ICR Fourier-transform ion cyclotron resonance傅里叶-变换离子回旋加速器共振
ICAT isotope-coded affinity tags
IEF isoelectric focusing等电聚焦
MALDI matrix-assisted laser desorption ionization基质辅助的激光解析离子化
Q-TOF quadrupole-TOF
RP reversed phase反向
TOF time-of-flight飞行时间

简介

蛋白质组学的核心组成是系统识别一个细胞或组织中表达的每一个蛋白质,以及确定每个蛋白质的突出特征(比如,丰度、修饰状态以及在多蛋白质复合体中的复杂状态)。这些分析的技术包括分离蛋白质和肽的分离科学、识别和定量分析物的分析科学和数据管理和分析的生物信息学。它的初步工具包括使用IEF(等电点聚焦)/SDS-PAGE凝胶的高分辨率的双向凝胶电泳(2DE),结合质谱和数据库搜索来分离、识别和定量在一个复合样本中存在的个体蛋白质,最终识别被分离的蛋白质。一个常用的方法用在Fig1中用图解说明。此技术以及由此而来的变化(综述见[1])已经被用来识别和分类在复杂样本中存在的大量蛋白质,并在蛋白质组数据库中呈现它们,该过程我们这里称之为"描述蛋白质组学"比如,Shevchenko等[2]从2D凝胶上系统地鉴定了150个蛋白质。数目庞大的这样的数据库现在可以找到。同样的技术现在已经被作为普遍的发现工具来动态检测一个细胞或组织对外来或内部干扰反应而在蛋白质组中的改变。因为检测动态改变需要精确定量每个被检测成分,我们使用"定量蛋白质组学"来定义。

在此报告中,我们总结了自1999年1月至2000年4月来报道的与蛋白质组学和质谱相关的最重要的进展。在核心质谱技术中的进展已经导致2DE为基础的蛋白质组学技术的进一步改进。它们同时又促进了传统凝胶为基础的方法的替代方法,诸如引入以同位素稀释理论为基础的精确蛋白质定量技术和蛋白质复合物的系统分析。

蛋白质组分析的MS技术进展

在此部分,我们总结了在MS设备、它们的控制和操作中的进展,以及比较质谱数据和序列数据库识别蛋白质所用的搜索工具的进展。
随着新型质谱仪的引入,蛋白质组学研究现存类型的质谱仪性能已经显著改进了。在此综述期间最普遍使用的仪器是可以分为两类:单一阶段的质谱仪和串联质谱为基础的系统。单一阶段的质谱仪,最显著的是基质辅助的激光解吸电离(MALDI)飞行时间(TOF)仪器,被用于无数通过肽质谱图谱技术大规模蛋白质识别的项目中。此方法在鉴别表达自小一些的和完全测序的基因组的蛋白质特别成功[3,4]。串联质谱仪器诸如triple quadrpole、离子捕获(ion-trap)和近来引进的混合quadrupole飞行时间(Q-TOF)被常规应用于LC-MS/MS或用电喷雾电离(ESI)来生成肽片段离子谱,以便通过搜寻序列数据库进行蛋白质鉴定。使用仪器控制程序来自动选择肽离子进行碰撞诱导的解离(CID)(数据依赖CID)的不断增多是这些MS/MS仪器的一个明显的趋势。

一些新的构造的具有高潜能的质谱仪被引入到蛋白质组学研究中产生深刻影响。两个研究组近来一个MALDI离子源和一个混合Q-TOF耦联了起来[5,6]。Q-TOF提供的质量准确性和敏感性提升了数据库搜寻结果并同时使它成为MS/MS从头测序的当然仪器选择。MALDI Q-TOF构造提供了激动人心的机会进行自动化和高通量应用以及在一个样品盘上存档样品进行日后研究的可能。Medzihradszky等[7]描述了一个不同的混合仪器称之为MALDI TOF TOF。此设备享有许多MALDI Q-TOF的优点,另外能够进行高能量CID和非常快速的扫描速率。傅里叶-变换离子回旋加速器共振(FT-ICR)质谱对于蛋白质组学来说相对陌生。这些设备具有非常高的敏感性和分辨率,质量精确性可以达到1ppm。这些特征被用来在一次分析中测量和定量几百种蛋白质的完整的分子质量[8]。Goodlett等[9]表明FT-MS测量的一个肽的准确质量以及可以容易获得的限制因素能够通过序列数据库搜索被用来识别蛋白质。蛋白质组学如果没有软件工具来进行质谱数据和序列数据库的关联将变得几无可能。现存的数据库搜索程序已经变得越来越成熟和可以(从网络)可获得。另外,引入了新的算法。主要相关程序是Sequest[10],MASCOT[11],PeptedeSearch[12],PROWL[13]和Protein Prospector[14]。在它们中间,Sequest使用CID谱设置了蛋白质识别的实验室标准(benchmark),因为它与边界MS/MS数据工作得最好,并高度可信,可以从整个LC-MS/MS实验中自动分析数据,并不需要任何使用者的破译工作。在所提的程序中,然而,只有Sequest不能在网络上搜索。MASCOT是一个新的、快速、网络可进入和多功能的程序,具有进行肽指纹分析、用部分破译或未破译的CID谱进行数据库搜索的功能。

描述蛋白质组学的进展

在此综述期间之开始,基本上所有的蛋白质组计划都是建立在分离蛋白质、 成像和定量的2DE和蛋白质鉴定的质谱联用的基础上。此方法通过上述的MS发展、2DE的进步和创新性的凝胶电泳和MS联用的推动下前进。2DE的前进包括引入新的荧光染色方法,与银染方法相比可以提供更高的敏感度、更大动态范围[15]和通过扩展第一向的pI范围与在2DE之前预分复杂的蛋白质复合物增强分辨率(综述参见[16])。Binz等[17]描述了一个新的方法来系统分离2DE分离的蛋白质。所有在2D凝胶中的蛋白质转移印迹到一个共价衍生有胰蛋白酶的膜上进行同步消化。生成的肽随之捕获在膜上,然后通过MALDI-TOF质谱指纹分析识别。总的2DE-MS方法已经被用来生成来自不同物种的无数细胞类型的注解的2D凝胶数据库。部分这些资源的列表可以通过因特网获得。(www.lecb.ncifcrf.gov/EP/table2Ddatabases.html)。

尽管这些进展推进了2DE为基础的蛋白质组技术,它们没有强调此方法检测具体类别蛋白质的根本限制,包括低丰度、差溶解度极大或极小体积以及极端的pI值。一些研究组因此探索在蛋白质组计划中替代一个或同时两个凝胶电泳象限。Loo等[18]直接用MALDI-TOF质谱仪扫描IEF凝胶替代2DE的SDS-SAGE象限,这样产生了一个"虚拟2D凝胶"成像,在其中蛋白质质量是用质谱测量的。Oda等[19]用制备用的反相(RP)-HPLC替代2DE的IEF相,Wall等[20]在溶液中应用制备用的IEF,随后用无孔的树脂在MALDI-TOF-MS之前进行HPLC分离蛋白质。Link等[21]完全摈弃了任何蛋白质分离。它们通过消化未分离的蛋白质样品并用二维(强离子交换/RP)层析(LC/LC)耦联到一个ESI-MS/MS设备上分析产生的肽混合物来分析复杂的蛋白质混合物。使用一个类似的LC/LC-MS/MS,我们成功地检测到低丰度酵母蛋白质,并因此证明此方法能够克服2D凝胶的局限性的动态范围[22]。

这些进展的目标是蛋白质组分析技术的更高的通量、更强的自动化和增强的综合性。可以预计这些进展将会持续,而且可能为显微制造技术应用所加速。它的早期范例包括制造样品处理设备[23,24]和表面增强的激光解吸/电离(SELDI)蛋白质芯片来分离和分析具有特定特征的蛋白质和肽[25]。尽管这些方法可能最终在一个样品中检测和识别每一个蛋白质,但是2DE是个例外,因为它本身不是定量的。

定量蛋白质组学

在非2DE为基础的蛋白质分析中加入一个定量的元素,可行的技术-稳定的同位素标记[26]已经被应用到蛋白质分析中。此方法涉及将化学组成相同但稳定同位素标记的内标准(如使用2H、13C、15N等)掺到样品中。因为电离效率对于不同肽是高度多变的,对于一个肽的唯一适合的内标准是标记有稳定同位素的同一个肽。定量蛋白质分布图因此用含有相同蛋白质但不同丰度、并标记有重稳定同位素的第二个样品与一个蛋白质混合物(参考样品)进行比较而完成。在理论上,分析对标本中所有的肽具有相同的序列但是不同的质量。因为肽对具有相同的物理化学特性,它们被认为在提取、分离和电离中具有相同的表现。因此,低和高质量组成的强度的比率提供了精确测定在原始蛋白质混合物中肽的相对丰度(因而得到蛋白质的)。三个研究组基于稳定同位素技术已经独立报告测量蛋白质分布图[8,19,27],另外两个研究组正在写它的手稿(H Langen等,个人通讯;P James等,个人通讯)。在方法中,掺入的同位素以及使用的分析步骤中这些技术存在差别。

Oda等[19]在含有自然丰度的同位素氮(14N,99.6%;15N,0.4%)的培养基中生长酵母培养物,而另外一个培养物在同样富集15N(>96%)的培养基中生长。在合适的生长期过后,收集细胞,通过RP-HPLC以及随后的SDS-PAGE提取和分离兴趣蛋白质。胶内消化切除的兴趣点导致肽段生成,然后用肽质量图谱鉴定。研究者测定了两个酿酒酵母生成的42个高丰度蛋白质,发现它们只在表达G1期细胞周期素CLN2的能力上有差异。此实验技术的差错百分比发现是优异的(±10%)。研究者们用同一技术继续研究在酵母蛋白-Ste20中的差异磷酸化状态。Pasa-Tolic等[8]利用稳定同位素耗竭的培养基传递一个特异的同位素信号到蛋白质中。它们比较在正常和少见的同位素耗竭(13C、15N和2H"耗竭")培养基中生长的E.Coli对钙压力反应。通过FT-ICR-MS进行了完整的蛋白质质量测定。尽管没有检测到蛋白质,200个不同蛋白质的表达比率进行了比较。

很明显,用15N富集或耗竭的培养基的稳定同位素代谢蛋白质标记与2DE或其它分离技术结合允许定量的蛋白质分布图。然而,此技术有一些缺点。首先,此技术不允许直接从组织中分析蛋白质。第二,稳定同位素富集的培养基昂贵,并可能它们本身影响到细胞生长和蛋白质生成。第三,因为同位素掺入导致质量的微小增加直到序列确定后才知道。因此,蛋白质鉴定必须在定量之前进行。

我们近来发表了一个建立在同位素编码的亲和标签(ICAT)基础上的新的定量蛋白质分布图方法[27]。在此方法中(Fig2),稳定同位素在半胱氨酸被一个重(d8)或轻(d0)试剂选择性烷基化后掺入。两个蛋白质混合物进行混合。在此时,任何一个可选用的分级分离技术来富集低丰度蛋白质或减小混合物的复杂性,而同时严格保持相对量。在分析前,蛋白质混合物用胰蛋白酶进行消化并通过一个单体亲和素-琼脂糖柱。因为ICAT标记含有稳定同位素信息以及一个生物素标签,ICAT标记(含有半胱氨酸)的肽被选择性提取进行微毛细管LC-ESI-MS/MS分析。ICAT标记对的共洗脱液的离子强度比率允许定量,而随后的MS/MS扫描提供了蛋白质识别。在单次分析中,在生长在半乳糖或乙醇上的酵母的蛋白质表达分布图之间进行了比较。

ICAT策略有几个优点。首先,此方法兼容任何量的从体液、细胞或任何生长条件下的组织中收集的蛋白质。第二,烷基化反应高度特异,而只在盐、去污剂和稳定剂(如SDS、尿素、盐酸胍)存在的情况下发生。第三,通过只分离含有半胱氨酸的肽肽混合物的复杂性下降了。第四,ICAT策略允许几乎任何类型的生物化学、免疫或物理分级分离,使其兼容低丰度蛋白质的分析。此方法存在两个缺点。第一,ICAT标记(~500Da)的大小是相当大的修饰,并在整个MS分析过程中保留在每个肽上。这使得数据库搜索的算法复杂化,特别是小的肽段(<7氨基酸)。只有小比例的蛋白质是没有半胱氨酸的(在酵母中为8%),然而,可以合成除了对巯基以外其它基团特异的ICAT试剂。

蛋白质混合物的分析

大多数细胞的功能都不是单个蛋白质而是蛋白质复合体也叫作多蛋白复合体来实现的。因此,特异性蛋白质相互作用的识别是蛋白质组学的一个关键性组成,因为它直接关系到生物反应中的蛋白质功能。总体上,上述分析蛋白质混合物的方法很适合蛋白质复合体的分析。确实,一些最有科学回报性的蛋白质质谱应用已经进入了这个舞台。Link等[21]用LC/LC-MS/ MS单步分析在酵母核糖体中识别了超过70个蛋白质。Rout等[28]彻底分析了酵母核孔复合体的组成、结构和转运机制。Rappsilber等[29]已经利用化学连接和MS检测多蛋白质复合体的空间组成,Heller等[30]已经检测了T细胞受体复合体的组成。这些项目极其依赖于高产出的完全分离靶复合体的技术。为了此目的,Bouveret等[31]发展了串联亲和纯化{TAP}方法,并通过检测酵母拼接体展示了它的令人印象深刻的效率。

结论

蛋白质组学的一个主要的力量是其通过系统分析表达的蛋白质来分析生物过程的动力学。此综述中所描述的技术进展,特别是精确测定扰动诱导的为数众多的蛋白质的量变,以及分析蛋白质功能复合体的能力显著增强了我们从全盘立足点研究生物过程和系统。随后的一年在蛋白质组学的研究领域将会是既令人印象深刻又激动人心的。继续的技术进展将使研究者们获得正真的蛋白质分析(即分析一个细胞中所有表达的蛋白质)并让对定义蛋白质功能状态至关重要的全面测定形式成为可能。

(0)

热评文章

发表评论