蛋白质组学

蛋白质组学技术及其在中药复杂体系研究中的应用

重要小贴士

“首期蛋白质组学培训会议”将于2017年12月8-10日在北京召开,本次培训班将邀请一线从事蛋白质组学及其在中医药领域应用的专家人员,深入讲解蛋白质组学分析方法的特点及选择、数据分析的流程及技巧、SCI论文撰写等法。了解培训详细信息及报名直接点击文章最下方阅读原文。

 

蛋白质组学技术及其在中药复杂体系研究中的应用

刘 璇, 岳庆喜, 果德安

(中国科学院上海药物研究所中药现代化研究中心, 上海 201203)

中药是经过大量、 长期中医临床的实践而总结产生的治疗方法, 历经 2 000 多年的临床应用,中药的有效性、实用性和科学性已经毋庸置疑, 中药可以被称为是我国传统文化的宝贵财富。但是, 中药是典型的复杂物质体系, 其复杂性使对其作用机制的研究非常困难。首先, 中药的来源具有多样性,其来源以植物药为主, 其次是动物药、矿物药等。各种来源的原料药导致中药中化学成分多种多样,化合物的多样性又继而导致中药表现出有多个效应器官、多种作用和多个作用靶点。另外, 中药的临床应用形式多以复方为主, 复方中多味药的配伍应用使得中药的研究更为复杂和困难。复方的研究中既需要研究各单方中各化学成分的生物活性, 又需要研究各单方之间的配伍规律及其协同作用方式等。因此, 中药复杂体系的作用机制研究中迫切需要应用现代科学发展的新技术和新手段, 探索适合中药研究的新方法和新模式, 才有可能真正揭示其药效物质基础和作用机制, 使其“复杂而可知”。

中药包括复方的现代化研究一直是中医药界多年来关注的焦点和研究的热点。近年来, 我国政府已经制定了一系列与中药及其复方现代化研究相关的纲领性文件和全局性规划。 在 2007 年的《中医药创新发展规划纲要(2006-2020 年)》中明确提出“充分运用中国所具有的中医、西医和中西医结合三支力量共同发展的历史积累和独特经验, 以及现代系统科学与复杂科学等理论和方法, 对中医药学蕴含的生命科学问题开展广泛深入的研究和探索,在丰富和发展中医药理论和方法学体系的同时, 争取在与中医药科学内涵相关的若干问题上取得突破”。同一时期, 2007年 7 月 NATURE 杂志一篇专门谈论中医药的文章里也指出, “中医药要想取得突破性进展, 必须依靠系统生物学技术”。系统生物学(Systems Biology)的概念于 1999 年由 Leroy Hood 提出, 是指对一个生物系统中所有组成成分(基因、 mRNA、蛋白质等)的构成及其在特定条件下这些组分之间的相互关系的研究, 其认识生物的观点是从局部观走向整体观。系统生物学认为生物系统具有“整体、层次、整合、动态”的特点, 生物机体内存在通过层次之间、网络之间、系统之间的整合和联系建立的无数个大小网络, 而不同网络之间的信息整合和传递使基因或蛋白质产生出最终的生物学功能。系统生物学的技术平台是各种组学,如基因组学、蛋白质组学、代谢组学、转录组学等,正是这些组学技术的发展产生了大量的生物学数据, 在对这些数据的分析(利用生物信息学)中可以获得对细胞、组织、器官和生物体不同水平的各种分子结构和功能及其相互作用的了解, 并通过计算生物学/生物信息学来描述和预测生物功能、表型和行为。系统生物学应用于中药研究的研究思路的提出, 为中药复杂体系的研究提供了崭新的思路和方法,成为目前中药现代化研究的热点。迄今为止,不少科研工作者都在系统生物学思路指导下开展了对中药复杂体系的研究。目前, 在基因组测序已经完成即对基因组静态的碱基序列已经清楚之后,系统生物学已经进入了后基因时代, 蛋白质组学等基因功能学的研究成为系统生物学研究的重点。以下重点介绍蛋白质组学的主要研究内容、研究技术及其在中药复杂体系研究中的应用。

1 蛋白质组学的概念和技术

蛋白质组学(proteomics)研究可以称为是生命科学研究进入后基因组时代的里程碑, 同时也是功能基因组时代生命科学研究的核心内容之一。蛋白质 组 (proteome) 这 一 概 念 最 早 是 由 澳大 利 亚Macquarie 大学的 Wilkins 和 Williams 学者在 1994年第一届意大利锡耶纳蛋白质会议上提出,并在1996 年发表了相关综述。蛋白质组(proteome)是指在一种细胞、组织或生物体中的完整基因组所对应的全套蛋白质, 而蛋白质组学(proteomics)就相应是指研究细胞、组织或生物体蛋白质组的组成及其变化规律的科学。

1.1 蛋白质组学的研究内容

蛋白质组学的研究内容包括表达蛋白质组学、结构蛋白质组学、比较蛋白质组学和功能蛋白质组学四方面的内容。 (1) 表达蛋白质组学是指采用高通量的蛋白质组研究技术分离鉴定某一细胞、组织或完整生物体内尽可能多以至于接近的蛋白质, 建立完整的蛋白质组表达谱以及相关的蛋白质数据库。表达蛋白质组学是从大规模、系统性的角度来研究蛋白质组学, 这也更加符合蛋白质组学研究的本质; 但是由于蛋白质的表达随着时间和空间不断变化, 要彻底分析生物体内所有的蛋白质将是一个难以实现的目标。 (2) 结构蛋白质组学是指对通过表达蛋白质组学得到的蛋白质进行三维结构的精确测定。 (3) 比较蛋白质组学是采用蛋白质组学整体分析技术, 针对不同时间和空间动态变化的蛋白质组进行比较, 分析不同处理组之间蛋白质组在表达水平、表达数量和修饰状态的差异。通过比较蛋白质组学的方法考察不同时期不同环境下细胞内蛋白质组成的变化, 继而发现并研究差异表达的蛋白质及其功能, 不仅可以了解疾病的发病机制, 寻找到与疾病诊断相关的特异性蛋白质和药物治疗相关的蛋白质靶点, 而且也可以揭示物理、化学和生物因素干扰疾病发生的分子机制。在药物包括中药的作用机制研究中, 应用最多的就是比较蛋白质组学的方法。 (4) 功能蛋白质组学研究主要包括蛋白质修饰状态(如磷酸化、糖基化、泛素化、乙酰基化等)、细胞内蛋白质与蛋白质相互作用以及蛋白质表达后在细胞内定位等的研究, 从而构建细胞内蛋白质间相互作用的图谱以及复杂的信号传递网络。随着蛋白质组学的发展, 其研究内容日益细化。例如, 蛋白质磷酸化是最重要的也是最常见的一种蛋白质翻译后修饰方式, 在哺乳动物细胞生命周期中, 大约有 1/3 蛋白质发生过磷酸化修饰。运用蛋白质组学的理论和分析方法研究蛋白质的磷酸化修饰, 可以从整体上观察细胞或组织中蛋白质磷酸化修饰的状态及其变化, 由此衍生出磷酸化蛋白组学(phosphoproteomics)这一新研究领域。

1.2 蛋白质组学的主要研究技术

蛋白质组学研究的基本技术包括: (1) 蛋白质组样品的制备; (2) 蛋白质组样品的分离; (3) 蛋白质的生物质谱鉴定; (4) 蛋白质空间结构的鉴定。

1.2.1 蛋白质组学样品制备

蛋白质组学样品制备的要求是尽可能完整地将所有蛋白质从细胞或者组织中提取出来, 是蛋白质组学研究的首要步骤。常用样品来源有体外培养细胞、活体组织标本、血清和体液等。使用体外培养细胞的优点是能够对特定的细胞组分或者亚组分进行分析, 不足之处在于培养细胞不能完全反映体内的真实情况, 且受实验条件等因素影响, 研究结果存在偏差。从活体组织标本中提取细胞蛋白,应避免血管组织、血细胞、周围结缔组织和间质等的污染。如果需要进行组织中单类细胞的分离, 可采用机械方法、免疫磁珠、荧光标记细胞分选或近来发展较快的且被普遍看好的激光捕获微切割技术(1aser capture microdissection)方法进行。从复合组织中特异性分离出特定的单一细胞或细胞群体, 这样可以避免组织异质性其他蛋白质成分对于目标蛋白质分析的干扰和影响, 确保研究结果的可靠性。用于蛋白质组学研究的蛋白质样品通常可采用细胞或组织中的全蛋白质组分, 也可以进行样品预分级, 即采用差速离心和密度梯度离心等方法根据蛋白质溶解性和蛋白质在细胞中不同的细胞器定位进行分级, 如可分离出细胞膜、细胞核、线粒体或高尔基体等细胞器的蛋白质成分。其他预分方法还有如用亲和层析的方法对有磷酸化修饰的蛋白质进行富集, 只进行磷酸化蛋白的研究等。

1.2.2 蛋白质组样品的分离

蛋白质组学分离技术主要包括基于蛋白质的分离(以双向电泳为例)和基于肽的分离(以先酶解后再进行液相色谱分离为例)两大类。

(1) 双向凝胶电泳(two-dimensional electrophoresis, 简称 2-DE) 技术 O’Farrell 等于 1975年首先创立, 其原理是根据不同蛋白质之间的等电点和分子量差异而分离蛋白质的。其中第一向蛋白质水平电泳是根据蛋白质的等电点不同, 在高压电场下进行等电聚焦电泳(isoelectric focusing, IEF);第二向蛋白质垂直电泳则是常规的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE), 是根据蛋白质分子量大小的差异导致电泳迁移率的不同而达到分离蛋白质的目的。双向电泳的凝胶经过考染或者银染后, 一般一张双向凝胶上可出现数百至上千个蛋白质点。由于双向电泳对于蛋白质的分离结果直观, 也便于计算机进行图像软件分析处理, 并能与质谱分析鉴定方法相匹配等优点, 因此双向凝胶电泳至今仍是目前最常用、最经典的蛋白质分离技术。不过, 双向电泳也有些不足之处, 例如对靠近 IPG 胶条极端酸性或碱性蛋白质、部分不溶于样品缓冲液的膜蛋白、低丰度蛋白质、疏水性蛋白质和相对分子质量特大( 200000)或特小( 8000)蛋白的分离仍有一定的困难; 电泳结果需要染色处理,此项操作费时、费力; 同时, 双向电泳凝胶的蛋白质载样量有限再加上不同的蛋白质与染料的结合差异较大会影响一些低表达蛋白质的分离; 此外,该技术尚不能与质谱直接联用从而难以实现完全自动化。值得一提的是, 近 10 年来,通用(GE)公司在传统双向电泳基础上开发的一种新型的高灵敏度荧光染料标记的双向电泳技术即凝胶内差别电泳(differential in gel electrophoresis, DIGE)技术逐渐获得广泛的接受和应用。该技术最大的特点是在分析中引入了内参, 通过将不同蛋白质样品(包括目标蛋白质样品和对照蛋白质样品)标记上不同的荧光, 将不同蛋白质样品在同一块电泳胶内分离,消除了胶与胶之间的差异, 避免了在使用不同凝胶操作过程中的人为性和偶然性, 从而使获得的结果更为可信; 并且减少了需要进行电泳的次数, 缩短了实验需要花费的时间。

(2) 蛋白质组分离技术 目前最常用的也是最有发展前景的,就是酶解后用多维液相色谱技术进行分离。单一的液相分离技术由于自身分离能力的限制, 常常不能满足蛋白质复合物分离的需要。多维液相色谱法是指两种或两种以上具有不同原理特性的液相分离方法的优化和组合, 该技术最突出的优点是对全蛋白质组分进行分析时歧视效应大大减小, 并能与质谱直接联用, 从而可以实现蛋白质分离与鉴定的在线联用与操作, 有利于蛋白质组研究的高通量化和自动化。多维液相色谱分离技术主要包括离子交换色谱与反相液相色谱联用分离技术、杂交相色谱分离技术、其它混杂的二维色谱技术和三维色谱技术等。 1)目前最常用于蛋白质组学分离的多维液相色谱技术是离子交换色谱与反相液相色谱的联合使用(Ion-exchange chromatography–RPLC, IEX–RPLC)。离子交换色谱技术是通过溶质在离子交换色谱固定相上具有不同的保留能力从而实现对样品分离的色谱技术。就蛋白质和多肽样品而言, 其表面带有的电荷与离子交换色谱固定相表面的电荷发生不同的静电相互作用, 利用这种相互作用的差异从而实现对蛋白质或多肽混合物的分离; 而反相液相色谱技术则是根据溶质疏水性的差异分离蛋白质或多肽混合物。通过这两种色谱模式的有效联合使用, 可以实现对复杂蛋白质组份的二维分离。 IEX–RPLC 的优势是通过 IEF可以得到很高的样品容量而 RPLC 与质谱之间有极好的兼容性。 当然, IEX–RPLC 也有缺点, 那就是分离过程需要花费较长的时间, 完成整个分离的过程可能需要几天的时间。 2) 杂交相色谱分离技术(Hybrid-phase chromatography separations)是应用一前一后的阴离子或阳离子交换柱快速的将等电点范围宽泛的蛋白质或多肽样品分离为带正电荷、负电荷和不带电荷三部分, 从而有利于样品的检测。3 )其他混杂的二维色谱技术 ( M i s c el l a n e o u s two-dimensional chromatography techniques)是用其它的液相色谱分离系统如分子大小排阻色谱(size exclusion chromatography, SEC)或静态金属亲合色谱(immobilized metal affinity chromatography, IMAC)与 RPLC 耦联, 前者已经被成功的应用于酵母、疫球蛋白融合蛋白和细胞色素 b6f 复合体蛋白质组的分析, 后者也被报道成功地改善了对蛋白质磷酸化位点的识别和鉴定。 4 ) 三维色谱技术(Three-dimensional chromatography techniques)是指对那些用二维色谱不能充分分离的复杂样品, 先用另外一种色谱技术进行预先分离, 例如有报道用SEC 预分离后再用阳离子交换色谱(strong cation exchange)串联 RPLC 进行人肝组织蛋白质组的分离。

1.2.3 蛋白质的生物质谱鉴定

如果说在蛋白质的分离中各种技术方法是并存的, 那么在蛋白质的鉴定中, 质谱作为主流技术的地位已无可争议, 质谱已经成为最常用的蛋白质鉴定技术。质谱技术早在 20 世纪初就已经出现,但当时一直应用于有机小分子领域, 直到 20 世纪80 年代质谱技术才渐渐进入生物大分子领域。随着20 多年来的发展和应用, 质谱技术逐步取代传统的氨基酸组成分析和 Edman降解测序, 成为蛋白质鉴定的主流技术、核心技术和支撑技术。质谱技术的基本原理是将蛋白质样品先经过离子化后, 然后根据不同离子间质子与电荷之比(m/z)的差异来分离并确定蛋白质的分子质量。因此, 用于蛋白质鉴定的各种质谱仪均由样品离子化装置、离子检测器以及质量分析器3 个最基本的部分组成。

样品离子化装置采用典型的“软电离”的方式电离蛋白质样品分子。所谓“软电离”是指在蛋白质样品分子电离这一过程中, 由于没有直接的外界能量作用于样品分子, 所以对样品分子结构破坏较少,从而保留整个蛋白质分子的完整性, 不会形成碎片离子。蛋白质样品分子“软电离”常用的两种离子化方法是基质辅助激光解吸离子化(MALDI)和电喷雾离子化(ESI)以及由它衍生出的纳电喷雾离子化(nano-ESI)。

(1) 基质辅助激光解吸离子化 (MALDI) 是指利用固体基质分子均匀地包埋蛋白质样品分子, 在激光的照射下, 基质分子吸收激光能量而蒸发, 从而携带蛋白质样品分子进入气相, 基质分子进一步将能量传递给样品分子, 从而实现样品分子的离子化。 MALDI 比 ESI 具有更宽的蛋白质或者多肽的质量分析范围和更高的盐离子的耐受性。

(2)电喷雾离子化(ESI) 是指将待测蛋白质样品溶解在溶剂中, 以液相方式通过毛细管到达喷口,蛋白质样品分子在喷口高电压的作用下形成带电荷的微滴, 随着微滴中挥发性溶剂的蒸发, 微滴表面的电场随半径减小而增加, 当到达某一临界点时,蛋白质样品分子以离子方式从液滴表面蒸发进入气相, 进而实现样品分子的离子化。 ESI 最主要的优点是它可以比较容易的耦联在线的分离方法; 此外, ESI 能够产生带有多电荷的离子, 通过比较低的质荷比界限实现对于多电荷的离子进行鉴定。

目前最常用的质量分析器包括傅立叶变换离子回旋共振质谱 (FTICR/FT)、线性离子阱质谱(LIT/LTQ)、四级杆离子阱质谱(QIT)和飞行时间质谱(TOF)4 种。例如, 配有基质辅助激光解析/电离的飞行时间质谱(MALDI-TOF)非常适用于鉴定 2-DE分离的蛋白点, 其原理是通过利用基质吸收激光的能量从而使固相的蛋白质样品分子离子化, 在电场作用下加速飞过飞行管道, 进入质量分析器的离子化肽段因为质荷比(m/z)的差异而发生分离, 样品质荷比(m/z)与飞行时间呈正比, 根据到达检测器的飞行时间不同而达到检测目的。通过测量肽段离子的相关参数, 可以获得蛋白质样品分子肽质量指纹(PMF)、肽序列标签(PST)或部分氨基酸序列等相关信息, 然后通过适当的软件搜寻相关的基因组和蛋白质组数据库,实现对蛋白质分子的定性鉴定。该方法操作简单、高效、快速, 其最大的优点在于离子电荷通常为 1~2 个, 而不是多电荷离子, 这对于分子质量较大的样品而言, 不会形成复杂的多电荷图, 有利对图谱清楚的解析, 适用于高通量大样本的蛋白质组的筛选与分析。此外, 该技术对于样品中杂质的容忍程度已相对较好, 排除了因盐类物质以及组织不纯等影响蛋白质样品分子解吸效率不稳定的因素。但该技术对小分子量蛋白质(特别是相对分子质量 50 000)检测效果较差, 鉴定到的蛋白质分子量覆盖度明显小于其他定量蛋白质组学技术。因此, 鉴于不同质量分析器在物理原理和分析性能方面有不同的特点, 通过重组不同性能的质量分析器, 可以获得 Q-Q-Q、 Q-Q-LIT、 Q-TOF、TOF-TOF 和 LTQ-FTICR等多种“杂交”型的质谱。近年来 Thermo Fisher 公司生产的新型杂交型质谱 LTQ–Orbitrap 是目前生物质谱研究领域最优秀的仪器之一。

1.2.4 蛋白质的空间结构鉴定

蛋白质空间结构的研究对于深入理解蛋白质功能与机理非常重要, 同时也是基于结构进行合理化药物研发及设计的基础。在国际上, 美国首先提出大规模测定蛋白质结构的计划, 现在已进入第二期的产出阶段, 其他发达国家(欧盟和日本)也相继启动了自己的结构基因组计划。当前国际发展趋势是以 X射线衍射作为解析蛋白质原子分辨率结构的主要手段, 核磁共振技术(NMR)和电镜技术(EM) 及其他新兴技术为辅助手段。

(1) X 射线晶体学技术 自 1895 年德国物理学家伦琴首次发现 X 射线以来, X 射线的应用越来越广泛。作为其重要分支之一的 X 射线晶体学技术,在解析许多无机及有机化合物空间结构中被广泛应用。在蛋白质结构解析中的应用最早是由佩如兹(Max Ferdinand Perutz)和坎德鲁(John Kendrew)应用该技术分别在 1957 年和 1959 年解析得到了肌红蛋白和血红蛋白的三维结构, 第一次准确测定出蛋白质这种生物大分子的三维结构。在随后的 30 多年里, 蛋白质晶体学稳健发展, 方法学趋于成熟,主要的仪器设备以及计算机软件都已市场化, 解析的蛋白质结构数目也逐年增长, 尤其是近几年来,随着各国结构基因组学的启动, 蛋白质晶体学各相关技术领域都得到突飞猛进的发展, 大大加速了大分子晶体结构解析的速度, 使得解析的蛋白质结构数目呈指数形式增长, 到 2007 年 7 月, PDB 库中的蛋白质结构数近 45 000 个, 其中 80%以上是由X 射线晶体学方法解析得到的。 X 射线晶体学的关键是得到高质量的蛋白质晶体, 将晶体进行X 射线衍射, 收集衍射图谱, 通过一系列的计算(晶体结构解析), 就可以得到蛋白质的原子结构。这种方法的优点是:速度快, 且不受大小限制, 无论是多大的蛋白, 或者蛋白与其他化合物的复合体, 只要能够结晶就能够得到其原子结构, 然而获得高质量的晶体却是一个并不容易突破的瓶颈。

(2) NMR 技术 NMR 用于蛋白质结构的分析是在上世纪 90 年代才成熟并发展起来的。简单的说, NMR 是指处于一个静磁场中的核子(质子和中子), 会由于磁场的作用而处于不同的能量状态, 当一个外界的摆动的磁场来扰动处于“平衡”状态的核子时, 吸收了能量的核子就会从不同的能级之间跃迁, 并在此过程中会释放出能量。而放出的能量被检测到之后, 经过分析和计算就可以得到蛋白质内部的原子的结构信息。它用于蛋白质结构分析的优点是:蛋白质处于溶液状态; 适合研究蛋白质-蛋白质, 蛋白质-核酸, 蛋白质-配基相互作用; 可研究蛋白质分子内部运动;也可研究膜蛋白。但是对蛋白的要求也较高:需要毫克量级的蛋白质; 要求溶解度大、高纯度、无聚集、足够稳定的蛋白质;适合于分析较小的蛋白, 对于较大的蛋白质(大于30 KDa)则一般需要 15N 标记或 13C、15N 双标记, 甚至 2H、 13C、 15N 叁标记。

(3) 电镜技术 低温冷冻电镜(cryo-EM)作为一种新兴的技术, 目前的应用还非常少, 并且比较狭窄。快速冷冻的样品制备方法与传统的干燥方法不同, 主要优点是生物样品可以保持在含水的状态下,因而更接近天然的生理状态。快速冷冻可以避免冰晶的形成, 使生物大分子的结构不被破坏。冷冻速度在毫秒量级, 可以用来观察瞬时过程。测定多亚基蛋白质聚合体的三维结构的电镜方法主要有二维晶体的三维重构法和单粒子法。结构分辨率有时可以达到 0.4 nm, 它们的计算方法一般比较复杂。电镜法可以与来自晶体或 NMR 的原子结构结合,构建庞大生物分子的高分辨率结构, 这一方法近年来在结构生物学中的应用备受关注。

(4) 其他 随着单分子技术如荧光共振能量转移(FRET)、原子力显微镜(AFM)、单分子操作、荧光光谱、拉曼光谱和快速光谱等的出现和发展, 这些技术在大分子物质尤其是蛋白质的构象分析中的应用也日益成熟。单分子探测的优点是避免了系综平均、时间或空间的平均, 可以直接观测单分子的涨落现象。通过建模分析构象的涨落和概率分布,可以构建或勾画出系统的势景(energy land-scape)函数。系统的概率分布应有一定的特征, 它们与系统的特定状态有关, 由此可以计算某些事件的概率或速率, 如反应速率。由于构象变化可以实时观测,反应过程的多个途径的随机选取可以被记录下来。这对理解反应的机理和动力学非常重要。所以, 这种方法刚好弥补了晶体学静态结构的缺陷, 因而成为晶体衍射法的一种良好的补充。

1.3 蛋白质组学与生物信息学的结合

值得一提的是, 在基因组学的发展过程中, 基因组学和生物信息学的结合为科研工作者获得了很多非常有价值的研究成果。与之相似, 蛋白质组学与生物信息学的结合也是蛋白质组学发展的必需要求。生物信息学是生物学与信息科学、数学、计算机科学等学科相互交叉而形成的一门新兴学科。生物信息学是通过采集、处理、储存、分析和解释由各种技术平台(如大规模 DNA测序、蛋白质组研究等)产生的海量数据, 来阐明和理解这些数据所包含的生物学意义。生物信息学在蛋白质组学中的应用基本包括以下方面: (1) 蛋白质组学数据库的建立和使用。例如可以建立并使用各种蛋白质的一级结构序列数据库、空间结构数据库、蛋白质双向电泳图像数据库、信号传导及蛋白质一蛋白质相互作用数据库、 DNA 和蛋白质相互作用数据库等等; (2) 蛋白质未知结构的预测。例如, 可以根据蛋白质的一级序列数据预测蛋白质的高级结构, 主要是根据同源系列的比对和某些关键的氨基酸残基的位置, 以已知三维结构和二级结构的蛋白质为依据, 预测未知空间结构的蛋白质的二级结构和高级结构; (3) 蛋白质未知功能的预测。 生物信息学最常用的分析方法是模式识别, 即利用存在于蛋白质序列结构中的某些特殊的特征模体来识别标志性的序列或者结构, 以此建立模式, 然后在已经建立好的已知蛋白质数据库中, 搜集与此相似的模式,来确定未知蛋白质的归属, 从而预测它的功能。比较的方法包括基于序列相似性比较、基于系统发育谱比较、基于结构域融合比较、基于 mRNA 表达类型的比较等。

2 蛋白质组学在中药复杂体系研究中的应用

由于各种疾病的发生和药物治疗靶点大多数是在蛋白质(酶、受体及信号转导蛋白)水平, 因此蛋白质组学非常适用于研究药物的作用机制、寻找有效的药物靶点及开发新药。蛋白质组学(结合生物信息学)在中药复杂体系的研究中至少可以有如下几方面的用途: (1) 通过比较正常状态和疾病状态及药物(中药中的单体化合物或有效部位或复方提取物)治疗后蛋白质组表达的差异,寻找药物的靶点相关蛋白; (2) 用生物信息学方法预测中药中单体化合物的可能直接蛋白质靶点, 并用蛋白质和化合物相互作用的相关验证方法(例如表面等离子体共振技术、化合物与蛋白质共结晶后进行 X 射线衍射等)进行验证; (3) 利用蛋白质-蛋白质相互作用数据库和中药的可能作用靶点绘制出中药的可能作用网络, 并用生物学方法进行验证; (4) 对于中药复方的研究, 可以分析复方中各单方的可能作用靶点, 利用信号通路数据库等推测各单方之间的可能相互作用,探索复方的可能配伍机理。

2.1 中药可能靶点相关蛋白质的寻找

通过比较对照细胞或动物组织的蛋白质表达谱和给予中药后蛋白质表达谱的差异, 可以找到中药的可能靶点相关蛋白质。目前, 这个方法已经在中药的研究中较广泛地应用, 目前蛋白质组学在中药研究中的应用实例大部分属于此类。该方法已被用于中药中单体化合物、有效部位及提取物的作用机制的研究。

2.1.1 中药单体化合物的靶点相关蛋白质研究

2003 年 MacKeigan JP 等通过蛋白质双向电泳分离与质谱鉴定相结合的技术, 发现红豆杉中分离的单体化合物紫杉醇(paclitaxel/taxol)和 MEK 抑制剂 合 用 时 改 变 了 RNA-binding regulatory subunit/DJ-1 PARK7)蛋白和 Rho GDP-dissociation inhibitor alpha 蛋白的表达。2004 年 Wenzel U 等发现黄酮类化合物槲皮素(quercetin)通过促进结肠癌细胞株 HT-29 细胞凋亡和分化从而抑制肿瘤细胞的增殖, 并通过蛋白质组学手段鉴定到其影响的一系列蛋白质。2005 年 Lee KH 等利用蛋白质组学的方法研究了紫杉醇在人宫颈癌细胞株 HeLa 细胞中的可能靶点相关蛋白质。 2006 年 Ha WY 等通过蛋白质组学技术阐明从远志科植物乌棒子(Polygala caudata)中分离的单体化合物 euxanthone诱导小鼠成神经细胞瘤 2a 细胞分化的分子机制可能是与被激活的转录因子 E2F transcription factor 5等有关。 2006 年 Chen DM 等利用蛋白质组学的方 法 考 察 了 芍 药 的 主 要 化 学 成 分 芍 药 苷(paeoniflorin)能延迟对于局部缺血性中风病理模型大鼠神经保护的分子机制。 2006 年 Wang Y 等利用蛋白质组学技术研究从湖北黄精提取的薯蓣素(dioscin)对人髓系白血病细胞株 HL-60 细胞的细胞毒性的分子作用机制, 2007 年 Wang Y 等进一步通过蛋白质组学技术研究 HL-60 细胞微粒体部分蛋白质组表达的变化, 阐明薯蓣素(dioscin)通过触发线粒体氧化应急反应, 从而诱导 HL-60 细胞的凋亡。2008 年笔者所在实验室 Yue QX 等用蛋白质双向电泳结合 MALDI MS/MS 质谱鉴定的方法研究了从中药灵芝中分离的单体化合物灵芝酸 D(ganoderic acid D)对于人宫颈癌细胞株 HeLa 细胞毒性的作用机制, 发现了可能是灵芝酸 D 靶点相关蛋白的 21 个差异表达蛋白。 2009 年Wang X 等利用蛋白质组学方法发现从藤黄中分离的 S 型藤黄酸(S-gambogic acid)抑制人肝癌细胞株 HepG2 细胞
增殖的蛋白质分子靶标为 stathmin 1 。

2.2.2 中药有效部位的靶点相关蛋白质研究

2008 年 Cheng ZX 等分析了从中药重楼(Rhizoma Paridis)中分离的总皂苷有效部位作用于人肝癌细胞株 HepG2 细胞 48 h 后蛋白质组的表达变化。2008 年笔者所在实验室 Ma C 等通过蛋白质双向电泳结合质谱鉴定的方法找到了 12 个可能与灵芝孢子总多糖(polysaccharides)刺激小鼠脾脏单核细胞增殖作用相关的蛋白质; 笔者所在实验室 Yao Y 等分别考察了三七总皂苷和丹参总酚酸抗血小板聚集作用的可能靶点相关蛋白质, 找到了三七总皂苷影响的与血小板聚集、氧化应急反应以及细胞骨架相关的蛋白质和丹参总酚酸影响的与钙动态平衡、抗氧化以及细胞骨架结构相关的蛋白质。笔者所在实验室 Yue QX 等通过蛋白质双向电泳结合蛋白质功能验证等技术阐明了灵芝总三萜(Ganoderma triterpenes)与抗肿瘤化学药物阿霉素合用对人宫颈癌细胞株 HeLa 的细胞毒性的分子机制, 其协同作用机制可能是通过增加氧自由基损伤和 DNA损伤以及诱导细胞凋亡杀死肿瘤细胞。笔者所在实验室 Ma C 等还考察了多种处理组(对照、环磷酰胺处理、灵芝孢子多糖处理和环磷酰胺加灵芝孢子多糖处理)的小鼠的胸腺组织蛋白质表达谱, 找到了 15 个可能与环磷酰胺的免疫抑制作用相关的蛋白质; 在这 15 个蛋白质中, 其中6个蛋白质在环磷酰胺诱导下的表达改变可以被合用灵芝孢子多糖所逆转, 这些蛋白质可能与灵芝多糖对抗环磷酰胺免疫抑制的能力有关。

2.2.3 中药提取物的靶点相关蛋白质研究

蛋白质组学在中药提取物(包括复方的提取物)的作用机制研究中也起到了重要的作用。例如, 由熟地黄、当归、白芍和川芎 4 味中药药材组成的四物汤是临床常用的经典补血名方, 近年来应用蛋白质组学方法在研究四物汤对血虚证动物和血虚证患者的作用机制方面取得了较大的进展。 (1) 2004年 Guo P 等研究了四物汤对于放射线照射后导致的血虚证小鼠骨髓蛋白质表达谱的影响, 发现四物汤能调节骨髓组织糖代谢, 促进造血生长因子信号转导和造血细胞的生长和分化, 可能由此发挥补血作用, 进而能逆转放射导致的血虚证。 (2) 2006 年Liu LL 等研究四物汤对于化学药物环磷酰胺损伤导致的血虚证小鼠骨髓蛋白质组的影响, 结果发现四物汤可能通过影响与细胞凋亡、造血干祖细胞增殖分化有关的蛋白质而促进骨髓造血。 (3) 2008年 Yang MH 等运用蛋白质组学技术考察了四物汤对于血虚证患者血清蛋白的影响, 结果发现四物汤可能是通过增强免疫、减轻基因损伤、增加血红蛋白等途径治疗血虚证。蛋白质组学在其他中药提取物的作用机制研究中的应用还有如 2006 年 WuH等利用蛋白质组学和免疫印迹等技术阐明台湾民间真菌药材樟芝(Antrodia camphorata)乙醇提取物抑制非小细胞肺癌细胞株 A549 细胞增殖、诱导肿瘤细胞凋亡的分子机制可能与诱发内质网应急反应、进而引起 5 个与肿瘤相关的蛋白质的表达量发生改变有关。 2008 年 Wang CY 等通过基因芯片和蛋白质双向电泳等方法研究台湾民间药材狭叶紫锥菊(echinacea purpurea)丁醇提取物作用于树突状细胞引起的基因组学和蛋白质组学的变化, 蛋白质组学的结果表明 12 h 后被处理细胞内与细胞骨架和抗氧化应急相关的蛋白质表达量上调。 2009年 Nquyen-Khuong T 等考察由中药五味子、大豆、栝楼和西地格丝兰提取物组成的混合物 MINA-05作用于人膀胱癌细胞 72 h 后蛋白质组的表达变化,鉴定了多种与细胞骨架、能量代谢、蛋白质降解以及肿瘤抑制相关的蛋白质, 提示 MINA-05 抑制膀胱癌细胞增殖是与肿瘤细胞周期、代谢、蛋白质降解以及生存环境的改变相关。 2009 年Lee TY 等考察由茵陈蒿、栀子和大黄等中药组成的复方茵陈蒿汤(Yin-Chen-Hao-Tang) 作用于肝纤维化的大鼠胆管结扎模型 27 d 后肝脏蛋白质组的表达变化, 结果发现茵陈蒿汤治疗大鼠肝纤维化的作用可能与抑制正常肝细胞的凋亡以及调控脂类物质的生物合成有关。

2.3 中药直接结合蛋白质靶点的预测和验证

蛋白质空间结构数据库的日益完善使得用生物信息学方法预测能与化合物直接结合的蛋白质靶点成为可能。常用的蛋白质空间结构数据库有CATH、 PDB、 SCOP、 MMDB、 ISSD 等。其中。PDB(protein data bank)数据库是目前最为详尽的蛋白质结构数据库, 它收录由 X 射线晶体衍射和核磁共 振 得 到 的 三 维 结 构 数 据 , 其 网 址为http://www.rcsb.org/pdb/home/home.do。在已知蛋白质空间结构的基础上 , 可以用反向对接 (inverse docking)-即用小分子配体搜索潜在的结合蛋白的方法预测化合物的可能作用靶点。例如, 笔者所在实验室与上海生物信息学研究中心合作, 用一种叫 INVDOCK 的反向对接软件寻找能够与灵芝酸 D直接结合的蛋白质靶点。 结果表明 14-3-3 蛋白可能是灵芝酸 D 能够直接结合的蛋白质靶点。对于生物信息学预测的直接作用蛋白质靶点, 还需要用生物学方法进行验证。笔者所在实验室采用体外表面等离子体共振技术(Surface Plasmon Resonance/SPR)分析方法用 BIAcore 3000仪器对灵芝酸 D 和 14-3-3蛋白的结合能力进行了验证。表面等离子体子共振是一种物理光学现象。利用金属薄膜表面的折射率的改变, 引起共振角的变化, 可以来推断金属薄膜表面的变化。具体实验时是先将目的蛋白质固定在镀有金膜的传感器芯片表面, 将可能与之相互作用的化合物分子溶于溶液流过芯片表面。检测器能跟踪检测溶液中的化合物分子与芯片表面蛋白质分子的结合、解离整个过程的变化。除了表面等离子体共振技术外, 还有很多其他的验证蛋白质和化合物相互作用的方法。例如, 可以制备化合物与蛋白质的共结晶再进行 X射线衍射确定结合的具体位点; 随后再定点突变蛋白质结合位点的序列, 考察是否还具有与化合物结合的能力等等。

2.4 中药靶点作用网络的绘制和验证

随着蛋白质相互作用研究技术(包括酵母双杂交、 GST 标记 pull-down、免疫共沉淀、亲和色谱、表面等离子共振等)的发展, 目前已经获得了大量的蛋白质-蛋白质相互作用数据。目前较大的蛋白质相互作用数据库有(1) BIND (The Biomolecular Interacfion Network Database) 数 据库 (http://bind.ca/)。该数据库包含了所有生物分子例如蛋白质、 DNA、 RNA、配基、复合体、基因还有一些未分类的生物实体的相互作用数据。 BIND 的数据来源包括期刊提交、公众提交、文献提取、其他蛋白质相互作用数据库导入等; (2) DIP 数据库 (http://dip.doe-mbi.Ucla.edu/), 专门存放实验确定的蛋白质之间相互作用的数据, 既包括经典实验手段确定的蛋白质相互作用, 也包括高通量实验手段确定的蛋白质相互作用数据; (3) STRING 数据库, 与BIND、DIP 数 据 库 不 同 的 是 , STRING 数 据 库 (http://string.emb1.de)不仅存储实验确定的蛋白质相互作用数据, 它还存放预测得到的蛋白质相互作用数据,并对各种预测方法得到的结果的准确性给出了相应的权重。

在获得化合物的直接蛋白质靶点(通过生物信息学预测并验证)信息和可能蛋白质靶点(通过比较蛋白质组学比较对照和给予化合物后蛋白质表达谱的变化)信息的基础上, 可以利用蛋白质-蛋白质相互作用数据库, 绘制出化合物的靶点作用网络。例如, 本实验室就用该方法绘制了灵芝酸 D的靶点作用网络。对于网络中的一些预测的中间蛋白质,可以再进行深入研究, 用生物学实验(如RNA 干扰、基因过表达等)进行验证。绘制靶点作用网络的方法可能对于中药的研究有特别适合之处, 因为中药往往是同时对多个靶点发生作用, 而对每个靶点的作用都不是很强。因此, 只有从网络的角度才可以获得对中药作用机制的比较全面的了解。

2.5 中药复方可能协同作用机制的研究

中药复方是在中医理论指导下的中医临床用药的主要形式, 也是中药有别于植物药或草药而具有的特色所在。药有个性之特长, 方有合群之妙用。“君臣佐使”的组方原则, “相须、相使、相恶”的作用规律, 是传统中医药学整体观和辩证论治的集中体现。只有充分研究揭示中药复方的物质基础和作用机理, 促进中药的现代化和用于指导新的中药的开发, 才是对我国宝贵的中医药最好的继承和发扬。中药复方中各单方之间的相互作用机制的揭示是中药研究的关键。笔者所在实验室进行了一些将蛋白质组学用于复方作用机制研究的尝试。例如, 我们在分别研究丹参总酚酸和三七总皂苷的可能作用靶点的同时也对丹参和三七的复方配伍机制进行了探索性研究。蛋白质组学用于复方研究的可能研究思路有:

2.5.1 生物信息学分析可能发生协同作用的靶点蛋白质或信号通路

在获得关于复方中各单方的可能蛋白质靶点的信息后, 我们可以用生物信息学的方法寻找可能发生协同作用的机制。产生协同作用的可能性包括: (1) 不同单方作用于同一蛋白质靶点, 在与该蛋白质的结合中具有协同作用。关于这一点, 可以通过分析不同单方化合物对于同一蛋白质的结合位点等进行研究; (2) 不同单方作用于不同蛋白质靶点, 但是这些蛋白质属于同一信号通路的不同组成部分, 因此单方之间存在着信号通路层面的协同作用。关于这一点, 可以通过将不同单方的蛋白质靶点在信号通路数据库中找到它们参与的信号通路后进行分析。

目前, 笔者所在实验室正在用这些方法进行丹参三七的分析工作, 对于丹参, 我们选取了其中代表性的化合物丹酚酸 B、紫草酸、迷迭香酸、丹参素四种化合物进行分析; 对于三七, 我们选取了其中代表性的化合物三七皂苷及其两种体内代谢产物进行分析, 目前已经获得了一些初步的结果(待发表)。

2.5.2 聚类分析单方和复方影响的蛋白质表达谱

在蛋白质组学研究时, 如果同时进行各单方和复方的研究, 就可以获得各单方及复方各自影响的蛋白质表达谱。通过比较分析这些表达谱, 可以获得一些对复方作用机制的了解。例如, 笔者所在实验室用大鼠心肌缺血再灌注损伤模型考察了丹参、三七、和丹参三七复方的药理作用及各处理组动物心脏的蛋白质表达谱。在此模型中丹参三七复方的药效作用优于单独运用的丹参或三七。蛋白质组学的分析结果显示, 如果对与缺血再灌注损伤最为相关的多个蛋白质在各处理组进行聚类分析, 丹参、三七单用能够不同程度地调节缺血再灌注导致的异常蛋白质表达; 与单方相比, 丹参三七复方能够使异常的蛋白质表达谱回到最接近假手术对照组的水平。这些结果提示蛋白质表达谱的变化和药效是吻合的, 蛋白质表达谱可以反映复方优于单方的特点(待发表)。

3 结语

中药复杂体系的研究需要以中医药传统的理论体系为指导, 借助现代生物医学的研究方法, 通过多技术辅助、多视角切入、多学科渗透交叉, 才能够全面、系统、正确地阐明中药尤其是复方的作用靶点、作用环节和作用过程。将系统生物学的理论与方法学引入中药的研究领域已经初步显示了其可行性与合理性, “系统生物学能够给中药研究带来突破”这一观念已经成为中药研究者的共识。蛋白质组学是目前系统生物学领域的研究热点, 蛋白质组学在中药复杂体系研究中的应用无疑给中药的研究带来很大的发展空间。本文综述了一些将蛋白质组学应用于中药研究的成功实例和目前的一些研究思路。可以预计, 随着蛋白质组学自身的发 展 , 蛋 白 质 组 学在 中 药 复 杂 体 系 的 研 究 中一定还会有更多的用途。另外, 要强调的是, 蛋白质组学只是系统生物学的组成部分之一, 很多研究者用系统生物学的其他技术平台如基因组学、代谢组学等也都取得了很好的研究成果。因此, 笔者认为在中药复杂体系的研究中最好综合应用多种系统生物学关键技术和手段, 把多种手段获得的结果进行融合, 只有这样才能够真正发挥系统生物学的优势, 建立与中医整体理论相符的整体研究思路, 从分子水平上阐明中药复杂体系的物质基础和作用机理, 为中药的现代化和国际化服务。







(0)

热评文章

发表评论