蛋白质组学

《cell》文献翻译:蛋白质组学与基因组学 – 《cell》细胞杂志 – 文献资源库…

蛋白质组学是新基因组学吗?0 m! x. k' s: t+ W z- C

. N8 Y1 F C( p: OJurgen Cox and Matthias Mann
6 H" \( q x |% m. n# T, J; b4 L Z/ {9 O' w: W9 C
Cell 130, 395—398, August 10, 20075 Z# _3 I* J4 C3 [" v; g D0 A. G
; X5 V$ i: Y j1 H {
3 T0 L3 D" V' k: K c! e" y6 F
}/ x0 F; O3 B3 | O. q- Q
    基于质谱(MS)的蛋白质组学已成为研究蛋白质翻译后修饰、蛋白质相互作用和细胞器的有力工具,目前它能否进行蛋白质表达的综合分析?
3 d7 U% d. u V. Q' r$ l1 k6 r6 p, A- J6 v8 k- x5 f

9 X1 C! ^, y( t3 ?5 W. m
8 h: H- R Z1 ]    分子生物学的许多重大发现来自寻找一种生物系统与另一种生物系统的某种功能的不同。例如,遍在蛋白化最初是通过比较受到压力的细胞与正常条件下的细胞的不同发现的。许多生长因子信号的知识来自将Rous肉瘤病毒转化的细胞与正常细胞进行比较。这些发现一般在很大程度上包括有运气成分,因为这些发现依赖于找出系统的某些可以测定的不同,从而可以进行综合的或全系统的分析。
$ h t" f" L% Q+ ]: f' q3 O
- j+ m7 N2 h' r1 O    细胞状态的不同反映在基因表达的改变上,这些改变包括信使(mRNA)水平和最终产物(蛋白质)水平的改变。第一个基因表达分析的 全基因组 方法是mRNA与固定在芯片上的互补序列的大规模杂交。因为每个可能的mRNA都可在已知位点放置在芯片上,微阵列原则上可包括整个细胞转录产物。尽管微阵列有极大的普遍性和用途,但也有某些局限性。这些局限性某种程度与技术有关,例如,在平台之间和实验室之间的重复性问题尚未完全解决。更重要的是,在预测成熟活性蛋白的变化量时,微阵列测定无法定量。蛋白质几乎总是生物功能的效应子,但蛋白质的水平不仅依赖于相应的mRNA水平,也依赖于翻译控制和降解调节。这些因素和增加mRNA合成一样重要,但它们无法用微阵列直接测定。. ]0 N* F* M6 V7 Z m+ Y0 P% `
0 e; k3 A0 p# E. ?) l6 o, J
    蛋白质的表达水平也许会提供鉴定生物系统的最密切相关的单一数据。 蛋白质组学 的目标是提供这样的数据。即使在十年之前,在蛋白质组学这个术语出现之前,已对此有很强的诉求。从20世纪70年代中期开始,人们就使用双向凝胶电泳研究蛋白质组学,但不幸的是该技术完全不能满足要求。随着电喷雾和MALDI电离技术的发展,作为现代蛋白质组学研究技术基础的生物质谱(MS),率先成为主流技术。这项进展使生物分子很容易进行质谱分析,并于2002年获得诺贝尔化学奖。随后又取得几项决定性的突破,包括处理微量生物样品的方法、通过将肽MS裂解谱与序列数据库比较进行肽快速鉴定的能力以及非常复杂的蛋白质复合物的直接分析。最近,高效可靠的MS仪器的出现又一次增加了基于MS的蛋白质组学的效力。质谱已成为探测翻译后修饰和蛋白质相互作用的有力工具。3 T! N9 W9 o ~
1 c% i- c+ @, d- J# U9 t T, W
    与此同时,在定量方法方面的进展较为缓慢。由于MS并不是天生就能定量,样品需进行稳定同位素标记。可以通过样品的化学反应,用轻或重同位素标记物进行标记,如早期使用的ICAT方法或更普遍使用的iTRAQ方法。此外,可以对整个蛋白质组进行代谢标记,或将同位素标记的肽掺入蛋白质组,以便能够对特定靶肽进行定量。尽管有上述以及其他独创性方法,至今只有为数不多的蛋白质组得到定量。最近,人们对若干技术和方法的进展进行了整合,以便改变这种局面,在本文中我们认为基于MS的蛋白质组学最终可以进行整个系统的蛋白质表达水平的测定。如果这一点可以成立,许多以前局限于mRNA水平的重要的全系统方法,现在就可以直接在蛋白质水平上进行操作。因此我们认为蛋白质组学可以成为 新基因组学 。
, ^1 m, I+ M. a/ E4 d: s% a
8 K: _. l# v' M2 w# _4 }全蛋白质组表达分析的挑战
 Q' ~% w: ?% v P
. b/ n* s: {/ c. O: s: `    尽管使用MS研究生物学问题已取得很大进展,但蛋白质组学面临的挑战是令人生畏的。为了使蛋白质适于MS分析,首先要将蛋白质降解成肽。然而,这个过程并不完全是均一的,而且含量丰富的蛋白质会产生许多可被质谱仪获取的冗余。对于在一个哺乳动物细胞中的大约10000个不同的基因产物的降解,可产生数目庞大的蛋白水解肽,远远多于可在MS分析运行中进行序列分析的数目。此外,MS裂解的肽并不完全能由搜索引擎准确鉴定。对这些因素进行分析后,Kuster等估计,以适当量呈递给质谱仪的肽,只有不到10%可达到有效鉴定。由于这些结果和其他局限性,一些研究人员对使用现有的方法,是否可用基于MS的 鸟枪 蛋白质组学对任何蛋白质组进行全面研究产生了疑问。其他的挑战还包括,不仅需要鉴定蛋白质,而且需要对细胞中蛋白质水平进行全面定量。
 K, q* y" N8 c
( i2 k. X6 [) u2 b! v+ m* i% f' i对蛋白质组进行定量
1 }. {1 ?0 @5 v7 w0 ^7 J) X' Y5 _
    为了解决定量的问题,我们使用了以同位素为基础的细胞培养物中氨基酸稳定同位素标记技术,或称为SILAC方法。通过使用SILAC方法,细胞通过基本稳定(非放射性)氨基酸的正常( 轻 )或 重 同位素形式,进行代谢标记,从而使蛋白质组可被MS区分。在这两个蛋白质组中每个氨基酸都被标记。由于轻和重标记的不同,按照质—荷比分离的每种肽有两种形式,例如,六个13C碳原子及六个12C碳原子。在两种标记形式之间的峰高比例直接代表在两种细胞状态之间蛋白质量的不同。
5 U" z5 M- ^/ H; n
' l) T* s, V2 w3 @! r    我们使用SILAC技术分析了阻碍酵母完整蛋白质组定量的因子,酵母是蛋白质组已得到清晰确定的唯一生物。我们发现对于使用现代仪器的全蛋白质组分析,低质谱灵敏度已经足够。然而,还有另外两个限制分析、阻碍全蛋白质组鉴定的参数。首先,仪器有限定的肽序列分析速度,只有三分之一的洗脱肽可裂解。使用高智能的搜索软件来避免相同或相近肽的重复测定,可以很容易解决这个问题。另一个限定是测定的动态范围,即在有最大丰度肽时,质谱能够测定的最低丰度的肽。我们估计通过样品分离以及MS仪器的改变,可以有足够的动态范围。
7 Y3 K( K, y. x9 x {5 O$ [) E! Z8 e! V! G: z; m2 @% s; }, x
    图1是一个使用SILAC技术对哺乳动物细胞蛋白质组进行分析的例子。用两种不同的氨基酸(轻和重氨基酸)对HeLa细胞进行标记,直接比较两种细胞状态。我们总共探测到239848个SILCA重复肽,鉴定出24230个非冗余肽序列,相当于HeLa细胞蛋白质组中的4034个可定量蛋白质。由此证实现代蛋白质组方法可以对很大一部分细胞蛋白质组进行定量。5 b) p9 a* Z6 S2 m" R8 P

+ c2 R/ }8 q O/ X$ E! W! b    图1D展示了该实验的另一个有趣方面,该图将蛋白质比率作为轻和重SILAC状态之间的丰度和折叠变化的函数。大部分蛋白质比率低于2,这代表了在一个大规模实验中,对基因表达定量的精确性很高。 q: ` u6 m2 J8 J8 v0 Y: p

0 t9 t) G0 N* X; _9 e$ Q$ u蛋白质组学和转录组学同样具有综合性
0 h! d: Y% z" k, J: W) \' M' P4 K# B; {1 r: w* x
    为了对目前基于MS的蛋白质组学的覆盖率与微阵列表达分析的覆盖率进行比较,我们分析了已发表的用Affymetrix微阵列测定HeLa细胞基因表达的数据。图2A展示了该微阵列数据与前面提到的蛋白质组学HeLa数据的比较。在MS数据和Affymetrix数据之间明显有很大的重叠,但探测到的大量数据或者只是mRNA或者只是蛋白质,这些数据的产生部分是由于代表在国际蛋白质索引(IPI)数据库中鉴定的蛋白质的668个基因在芯片上不存在。在得到确切测定的代表mRNA或蛋白质的7278个基因中,基于MS的蛋白质组学定量测定的基因占55%,微阵列定量测定的占77%。这表明两种方法都能有效地提供基因表达的综合性 全系统 测定。 s/ f9 Y; g* l2 W! s- I

% \; w, n6 y) f    取决于细胞的来源,蛋白质组学可能是一个比微阵列分析更好的研究工具。某些组织和体液,例如血液,没有相应的mRNA,因此更适合进行蛋白质组学分析。图2B展示了通过 无标记 蛋白质组学,对这类组织进行定量的可能性。无标记蛋白质组学是指没有同位素标记,通过对不同样品的MS测定进行直接比较来定量。与基于稳定同位素的技术不同,无标记蛋白质组学不能控制样品引发的变化,而且样品是分别进行分析,因此定量结果精确性一般不高。在上述例子中,对两个个体的脑组织样品中的蛋白质进行抽提,并分别用MS进行分析。通过比较两个样品的洗脱峰总质谱的响应,对二者的肽进行定量。图2B总结了几千种蛋白质的定量。大多数蛋白质的比率几乎是1∶1,较高强度信号有相对较好的定量结果。尽管还达不到基于SILAC定量的精确性,但与标准微阵列实验中得到的mRNA水平的定量精度基本相同。# c- ^! c1 B% j1 g. i- R$ |

/ s- ], y, @) w$ a3 V前瞻2 H1 E. o- i* Z1 h( c
* F% l* o0 m1 D; I0 c: a) M; p# ]8 U' A
    尽管蛋白质组学还面临许多技术挑战,但目前的技术水平可以对细胞蛋白质组进行全面定量。在使用稳定同位素时,这类大规模实验中的定量可以十分精确,这对几十年来蛋白质组学所追求的目标而言,是巨大进展。蛋白质组学在几个方面确实还落后微阵列技术几年。例如,目前微阵列测定更快,而且由于可以扩增,所需要的起始材料比蛋白质组分析要少。此外,微阵列设施比高端蛋白质组学实验室更容易设立。然而,在几百个实验室中很快就会有非常先进的MS仪器,蛋白质组全面分析的测定时间很快就会大大缩短。- \; r' @2 ~% A9 [- L) R
% I* C. t- x+ t
    回顾在过去十年中基于MS的蛋白质组学如何迅速发展是有益的。10年前,以极高灵敏度对单个蛋白质进行序列分析是一项艰巨任务。今天,在一个实验中鉴定几百个蛋白质几乎是理所当然的。我们认为,在这个领域中,在可预见的将来,技术能力每年至少可翻一番,这是蛋白质组学的摩尔定律。另外,如其他作者指出的,由于大多数蛋白质和肽已被测定并已储存在数据库中,蛋白质组学将从 发现 转移到 再测定 模式。这将更迅速地走向全面、快速和简便的全蛋白质组定量。2 V7 r" l9 N4 g. r: {$ A5 L5 y% k! y

( Y9 d$ }, a$ R# D    有一些令人感兴趣的理由,可认为蛋白质组学是基于mRNA的测定的补充和变更。首先,在微阵列不可使用的领域,蛋白质组学正在成为大规模测定基因表达的切实可行的替代方法。主要的例子如血液和体液,在这些例子中,重要的蛋白质主要位于细胞外,mRNA测定没有直接相关性。第二,尽管实验的复杂性有所增加,但测定蛋白质实际水平,而不是使用mRNA水平作为替代物,更有吸引力。蛋白质组测定可给出所需要的最终结果,即目标基因的蛋白质表达水平。相反,在微阵列中观察到的变化可能需要进一步进行RT-PCR或Western印迹实验,以便测定是否观察到的变化已到达蛋白质水平。在理想状况(无资源限制)中,应可进行微阵列和蛋白质组双重测定,这种测定的明显优点是可直接将由于转录增加引起的变化与由于翻译或蛋白质稳定性引起的变化进行区分。
# U$ b+ d+ M. r0 q7 P# _$ Z: k; o/ ^. \5 I8 R
    另一个使我们相信蛋白质组学将成为 新基因组学 的原因是它不限于细胞整体的表达谱。这项技术很容易用于细胞区室、细胞器及其时间分辨动力学。第一代亚细胞结构的蛋白质组图已存在,它们可与基因组数据 重叠 ,使它们有很好的亚细胞解析度。此外,研究细胞动力学的经典方法是基于荧光和显微镜。如最近用细胞核作为模型系统所展示的,这些经典方法可与定量的及时间分辨的蛋白质组学结合,将这些高通量方法的效能引入细胞生物学。
' u" p( R q# B* g* W: p) V* z A7 ]
    另一个蛋白质组学可以进入而基因组学无法进入的领域是对蛋白质修饰及其在细胞变动时的定量变化进行大规模测定。对蛋白质活性而言,它的修饰及其变化和蛋白质表达水平一样重要。基于SILAC和iTAQ的定量蛋白质组学能够测定复杂蛋白质组中的翻译后修饰,如果修饰肽能用生化方法富集更是如此。例如已经测定了在一个多于6000位点的 磷酸化蛋白质组 中,由于生长因子刺激而引起的专一位点和时间分辨的磷酸化变化。因此蛋白质组学可以测定细胞对蛋白质活性水平变化的响应,也能测定下游基因表达的变化。这些数据可使我们对细胞如何做出决定有更深入的了解,也可作为系统生物学的基础。
+ T, S8 D7 ~0 R4 v( v






(0)

热评文章

发表评论