代谢组学

植物代谢组学的研究方法及其应用

近年来,随着生命科学研究的发展,尤其是在完成拟南芥 (Arabidopsis thaliana) 和水稻 (Oryza sativa) 等植物的基因组测序后,植物生物学发生了翻天覆地的变化。人们已经把目光从基因的测序转移到了基因的功能研究。在研究 DNA 的基因组学、mRNA 的转录组学及蛋白质的蛋白组学后,接踵而来的是研究代谢物的代谢组学 (Hall et al.,2002)。代谢组学的概念来源于代谢组,代谢组是指某一生物或细胞在一特定生理时期内所有的低分子量代谢产物,代谢组学则是对某一生物或细胞在一特定生理时期内所有低分子量代谢产物同时进行定性和定量分析的一门新学科 (Goodacre,2004)。它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。

代谢物是细胞调控过程的终产物,它们的种类和数量变化被视为生物系统对基因或环境变化的最终响应 (Fiehn,2002)。植物内源代谢物对植物的生长发育有重要作用 (Pichersky and Gang,2000)。植物中代谢物超过20万种,有维持植物生命活动和生长发育所必需的初生代谢物;还有利用初生代谢物生成的与植物抗病和抗逆关系密切的次生代谢物,所以对植物代谢物进行分析是十分必要的。

但是,由于植物代谢物在时间和空间都具有高度的动态性 (stitt and Fernie,2003)。尤其是次生代谢物种类繁多、结构迥异,且产生和分布通常有种属、器官、组织以及生长发育时期的特异性,难于进行分离分析,所以人们一直在寻找更为强大的检测分析工具。在代谢物分析领域,人们已经提出了目标分析、代谢产物指纹分析、代谢产物轮廓分析和代谢表型分析、代谢组学分析等概念。20世纪90年代初,Sauter 等(1991)首先将代谢组分析引入植物系统诊断,此后关于植物代谢组学的研究逐年增多。随着拟南芥等植物的基因组测序完成以及代谢物分析手段的改进和提高,今后几年进入此研究领域的科学家和研究机构将越来越多。

1 研究方法

代谢组学分析流程包括样品制备、代谢物成分分析鉴定和数据分析与解释。由于植物中代谢物的种类繁多,而目前可用的成分检测和数据分析方法又多种多样,所以根据研究对象不同,采用的样品制备、分离鉴定手段及数据分析方法各不相同。

1.1 样品制备

植物代谢物样品制备分为组织取样、匀浆、抽提、保存和样品预处理等步骤 (Weckwerth and Fiehn,2002)。代谢产物通常用水或有机溶剂(如甲醇和己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性的亲脂相和极性相分开。分析之前,通常先用固相微萃取、固相萃取和亲和色谱等方法进行预处理 (邱德有和黄璐琦,2004)。然而植物代谢物千差万别,其中很多物质稍受干扰结构就会发生改变,且对其分析鉴定所采用的设备也不同。目前还没有适合所有代谢物的抽提方法,通常只能根据所要分析的代谢物特性及使用的鉴定手段选择合适的提取方法。而抽提时间、温度、溶剂成分和质量及实验者的技巧等诸多因素也将影响样品制备的水平。

1.2 成分分析鉴定

对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤,也是最困难和多变的步骤。与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大,要对它们进行无偏向的全面分析,单一的分离分析手段往往难以保证。色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于代谢组学的研究 (许国旰和杨军,2003),一般根据样品的特性和实验目的,可选择最合适的分析方法。目前最常用的分离分析手段是气相色谱和质谱联用 (GC/Ms)、液相色谱和质谱联用 (LC/MS)、核磁共振 (NMR) 以及傅里叶变换红外光谱与质谱联用 (FTIR/MS)。

1.2.1 气相色谱和质谱联用,液相色谱和质谱联用 色谱是最常用和有效的分离分析工具,其与质谱的联用则可以完成从成分分离到鉴定的一整套工作。GC/MS 和 LC/MS 可以同时检测出数百种化合物,包括糖类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物 (Taylor et al.,2002;Tolstikov and Fiehn,2002)。GC/MS有很好的分离效率且相对较为经济,但需要对样品进行衍生化预处理,这一步骤会耗费额外的时间,甚至引起样品的变化。受此限制。GC/MS 无法分析膜脂等热不稳定性的物质和分子量较大的代谢产物。Roessner 等(2000,2001a,2001b)利用 GC/MS 对马铃薯 (Solanum tuberosum 'Desiree') 进行高通量代谢物分析,同时检测到150种化合物,其中77种被鉴定为氨基酸、有机酸或糖。利用 GC/MS 进行代谢组学研究的代表性工作是 Fiehn 等(2000) 的一系列有关植物代谢的研究。他们用 GC/MS 对模式植物拟南芥的叶子提取物进行了研究,定量分析了326个化合物,并确定了其中部分化合物的结构。

LC/MS 中目前应用较广的是高效液相色谱和质谱联用 (HPLC/Ms)。HPLC 与 GC 原理相似,但在进样前不需进行衍生化处理,适合那些不稳定、不易衍生化、不易挥发和分子量较大的化合物。HPLC/MS 选择性和灵敏度都较好,但分析的时间相对较长,且需依赖纯的参照物。Fiehn (2003)利用 HPLC/MS 检测笋瓜 (Cucurbita maxima 'Gelber Zentner')叶柄和叶片抽提物,检测到了超过400种代谢物,有90种被定性,其中大部分是氦基酸、糖和糖苷。Huhman 和 Sumner (2002)在紫花苜蓿 (Medicago sativa,Polish Variety Kleszczewska) 和蒺藜状苜蓿 (Medicago truncatula) 中各鉴定出15个和27个皂角甙,并在紫花苜蓿中找到了2个新的乙二酸皂角甙。

最近,由 LC/MS 发展而来的毛细管电泳质谱联用技术 (CE/MS) 也被应用到代谢组学研究中。CE/MS 分离样品效率比普通的色谱质谱联用要高得多,更为便利的是其耗时很短,往往在10分钟内就能完成一个样品的分析过程。Tolstikov 等(2003)用 CE/Ms 对拟南芥进行代谢组分析,分离效果远远超过了 Fiehn 等用 GC/MS 进行的先期工作,检测到超过700个不同的色谱峰值,其中包括许多以前未检测到的脂类化合物及次生代谢物。

色谱质谱连用技术是目前植物代谢组学研究中应用最多的方法,它具有分离效率高、灵敏度好及经济实用等优点。但需要解决的主要问题是:大量色谱峰的识别问题以及方法的重现性问题。

1.2.2 核磁共振 在代谢组学领域,核磁共振最初被用于病理生理学和药理毒理学方面 (Nicholson et al.,1999),但目前也已被广泛用于植物代谢组学研究 (Blingly and Douce,2001),其优点是非常明显的。首先,不同于质谱具有离子化程度和基质干扰等问题,NMR 没有偏向性,对所有化合物的灵敏度是一样的。其次,NMR 无损伤性,不破坏样品的结构和性质,可在接近生理条件下进行实验,可在一定的温度和缓冲液范围内选择实验条件,可以进行实时和动态的检测。此外,NMR 氢谱的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样品中各组分的相对含量,更为直观 (颜贤忠 等,2004)。因此,NMR 方法很适合研究代谢产物中的复杂成分。Ward 等(2003)用 1H-NMR 对多种不同生态型的拟南芥进行了代谢组分析,在碳水化合物和脂肪族物质中都发现了差异,说明了植物代谢物和生态型差异的相关性。HyungKyoon 等(2004)用 1H-NMR 对野生型和过表达水杨酸合成基因的转基因烟草 (Nicotiana tabacum) 的叶片和叶脉进行了研究,通过进行 TMV 嫁接和对照实验,得到多个峰值变化,大部分峰被鉴定为氯原酸、苹果酸和糖。此实验提供了一种有效的不需过多步预处理程序的区分野生型和转基因植物的方法。当然 NMRt 也有其缺点,与 GC/MS 和 LC/MS 相比, NMR 的缺点是灵敏度低,有可能形成信号重叠,且其对样品制备的要求很高。同时因为动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物。

1.2.3 傅里叶变换红外光谱质谱联用 FTIR/MS 联用最近也被应用于植物代谢组学分析。FTIR 主要测定样品中各成分的功能基团和高极性键的振动,而特定的化学结构有特定的吸收频率,通过测定实验样品的红外吸收频率和强度,可以辨别出各个成分。FTIR 具有扫描速度快、光通量大、高分辨率、高信噪比及测定光谱范围宽的特点;缺点在于不可区分异构物,且组分片段和一些络合离子也对其有影响,由于离子抑制不能进行定量分析。Aharoni 等(2002)利用高分辨率的 FTIR/MS 联用仪器对凤梨草莓 (Fragaria ananassa) 组织进行了分析,依据不同的质荷比找到了5844个不同质量的物质,并根据对化合物中高含量的元素的精确质量测定估计了其中一半以上物质的化学结构式。结果表明,在草莓的不同组织中都含有多种类的初生代谢物(如氨基酸、脂肪酸和碳水化合物)及次生代谢物(如类黄酮和萜类化合物)。

1.3 数据分析与解释

样品成分分析鉴定之后,需要对所获得的数据进行相应的整合处理,这也是代谢组学研究中十分关键的步骤。应用高通量的检测分析工具可以得到海量的数据,如果不对其进行合理的处理,这些纷扰的数据反而对研究工作是有害无利的。可应用模式识别和多维统计分析等方法从这些大量的数据中获得有用的信息,这些方法能够为数据降维,使它们更易于可视化和分类。目前数据分析常用的两类算法是基于寻找模式的非监督方法 (unsupervised method) 和有监督方法 (supervised method)。

1.3.1 非监督方法 非监督方法是用来探索完全未知的数据特征的方法,对原始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里,并采用相应的可视化技术直观地表达出来。应用在此领域的常见方法有聚类分析 (cluster analysis) 和主成分分析 (principal components analysis,PCA) 等。

聚类分析依据物以类聚的原理分析具有相似性的事物,将分类对象置于一个多维空间中,根据事物彼此不同的属性进行辨认,将性质相近的归入一类,这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类,并找出每一类事物共同特征的分析工具。具体到代谢组学中,被归入一类的物质有相同的特征,可能有相同的功能作用,这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用。聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量;产生一个相似矩阵;决定把目标总体细分为几类,及其对每一种类别相应的定义;实施聚类分析,产生结果。

主成分分析是目前应用最为广泛的多维分析方法之一。PCA 的特点是将分散在一组变量上的信息集中到某几个综合指标,即主成分 (principal component,PC) 上,利用这些主成分来描述数据集内部结构,实际上也起着数据降维的作用。主成分是由原始变量按一定的权重经线性组合而成的新变量。这些变量具有以下性质:1)每一个 PC 之间都是正交的;2)第1个 PC 包含了数据集的绝大部分方差,第2个次之,依此类推。这样,由头2个或3个 PC 作图,就能够很好地代表数据集所包含的生物化学变化 (Sumnera et al.,2003)。

1.3.2 有监督方法 如果存在一些有关数据的先验消息和假设,有监督方法比非监督方法更适合且更有效。有监督方法在已有知识的基础上建立信息组 (class information),并利用所建立的组对未知数据进行辨识、归类和预测。在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督学习。应用于该领域的常见方法有线性判别分析 (linear discrimination analysis)、偏最小二乘法-显著性分析 (PLS-discrimination analysis) 和人工神经元网络 (artificial neural networks,ANN) (Lindon et al.,2001)。

1.3.3 网上数据库 在信息时代,利用网络资源进行研究是必不可少的。而对千头万绪的植物代谢物研究,建立相应的网上数据库也是势在必行的。这些数据库的建立也有利于联结代谢组学与其他系统生物学分支的关系(Oliver et al.,2002;Ge et al.,2003)。目前,最为成熟的数据库是关于模式植物拟南芥的The Arabidopsis Information Resource(TAIR) (Rhee et al.,2003),http://www.arabidopsis.org。其他常用的网上植物资源有 http://www.york.ac.uk/res/garnet/garnet.htm,http://www.maizegdb.org,http://www.genome.ad.jp/kegg/pathway.html。此外网上已有一些与代谢和代谢组学有关的数据库 (Raoul et al.,2004),主要介绍以下几个。

ArMet (http://www.armet.org) 是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的时间,甚至还有详细的实验步骤,并将代谢物信息标准化,以便于研究者交流。

DOME (关于 OMEs 的数据库,http://medicago.vbi.vt.edu/dome.html) 有许多关于代谢物的原始数据和分析结果,同时也有对人们感兴趣的一些植物物种的分子生物学研究,分析结果用多维统计软件处理后可用于 OMEs 的浏览器 (BROME) 浏览。

MetaCyc (http://metacyc.org) 是一个关于代谢物的数据库,阐述了超过150种生物体中的代谢途径,包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料。

MMP (http://www.chem.qmul.ac.uk/iubmb/enzyme) 对主要代谢途径及涉及的关键酶进行了详尽的描述。

2 代谢组学在植物中的应用

虽然植物代谢组学目前尚处于萌芽阶段,但其应用前景是十分广阔的 (Maloney,2004)。下面介绍其中的部分应用。

2.1 代谢组分析

应用代谢组学技术可同时对大量代谢物进行定性定量分析,常用来观察植物在环境条件改变下的代谢物变化;也可用于研究同一植物不同部位或不同时期的代谢物种类与含量变化;也可根据相关联的代谢物的量的变化,推测相应的代谢途径和代谢网络。Fiehn (2003)利用 GC/MS 对笋瓜 (Cucurbita maxima 'Gelber Zentner') 的叶柄脉管抽提物和叶片抽提物进行了代谢物分析,得到了400多个峰,通过与质谱数据库比对,对其中一小部分进行了定性,初步判断为何种物质;比较了叶柄与叶片间代谢物组分的不同。值得注意的是,即使个体中每种代谢物的量变化很大,其各组分间的比值也能一直维持稳定,这说明了植物中的代谢物虽然种类繁多,但都是互相关联的。植物利用复杂的机制来维持体内主要代谢物相对稳定的水平。对代谢组的分析力求可检测样品中每种代谢物,并可监测各种条件变化下代谢物的变化,这是进行功能基因组学研究的基础。






(0)

热评文章

发表评论