代谢组学

Nat. Methods 鉴定稳定同位素标记的生物体中代谢组的化学信息学方法

复杂代谢组的结构鉴定目前在质谱数据挖掘领域仍然是一个挑战。代谢物离子的结构表征需要从复杂的质谱信号中解开小分子的质量碎裂,然而,90%的质量信号被认为是人工造成的或者是冗余离子,例如不同的加合物形式和内源的由代谢物产生的碎片离子。

     植物是生物技术和药物发现的重要资源,据估计,目前基于质谱(MS)的代谢组学的覆盖率 5%,与天然产物的化学空间相比是非常低的。因此,代谢组学技术的进步对于天然产物的高通量筛选以及从代谢物的角度更好的理解植物生理学是必不可少的。

     增加代谢物结构注释的可信度的一种方法是使用同位素标记法。比较完全13C标记的和未标记的生物体,其中真正的代谢物在其LC-MS数据上会表现出与分子中的碳含量一致的母离子m / z位移。然而,很少有软件工具能够解决在化学式预测之上的代谢物结构的注释。

     作者在来自12种植物的31个组织样本中测试了他们的代谢物结构注释方法,他们的方法由十步化学信息学工作流程组成。1:通过MS-DIAL-PCE识别多余的峰特征,比如加合物和内源碎片。2:通过MS-DIAL-IFA,对正离子和负离子数据之间的质量位移比对进一步确认加合物的形式。如果在两种电离模式中都没有估计质量特征,则暂时将离子类型视为质子加合或丢失。3:参考代谢物质谱数据库,检索该离子是否有已知结构注释(注释水平为1级或2.1级,视数据库而定)。4:通过MS-DIAL-ISO,使用未标记和完全13C标记的植物组织数据确定碳元素数(注释水平3.2级)。5:限制碳原子数之后,通过改进的MS-FINDER确定化学式(注释水平3.1级),计算其理论的MS / MS谱。6:在结构数据库中检索二级谱对应的结构候选者。7:当在数据库中找到候选结构时,通过MS-FINDER程序对它们进行打分排序。8:当没有发现对应结构时,进行碎片集富集分析FSEA以获得代谢物所属的大类信息。9:对于所推定的代谢物结构,在由MS / MS相似性,本体术语(ontology term)相似性和生物反应关系所构成的代谢组网络中检查其可信程度。10:检索文献检查谱图中特征的产物离子和中性丢失(2.2级),对代谢物结构进行推定。谱图记录在RIKEN PlaSMA网站上。

     总之,本文报道了一种使用完全碳13标记和未标记植物和LC-MS / MS进行代谢物结构表征的计算方法。他们将此方法应用于来自12种植物的31种组织,在3604种碳元素相关的代谢物离子中成功鉴定出1,092种结构和344种化学式,其中69种代谢物的结构目前未在代谢组数据库中列出。

本文作者:CY







(0)

热评文章

发表评论