科研动态

最全面的三维基因组学研究技术——Hi-C测序

Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture, 3C)技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。Hi-C技术不仅可以研究染色体片段之间的相互作用,建立基因组折叠模型,还可以应用于基因组组装、单体型图谱构建、辅助宏基因组组装等,并可以与RNA-Seq、ChIP-Seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。

Hi-C技术的应用领域

一、Hi-C辅助动植物基因组组装

Hi-C技术源于染色体构象捕获技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。基于Hi-C数据中染色质片段间的交互强度呈现出随距离衰减的规律,Hi-C可以用于基因组组装,将杂乱的基因序列组装到染色体水平。

1.技术原理

Hi-C之所以能用于基因组组装,是基于染色质片段间的交互强度呈现出随距离衰减的规律(图1)。

图1. Hi-C相互作用强度与距离关系

其与遗传定律类似,可以用来判断scaffolds 的分类及相邻关系;分以下三步:聚类—排序—定向(cluster-order-orient)

更加形象的原理展示如图2:

图2.Hi-C辅助基因组组装原理[1]

2. 应用范围

1)无论是Sanger测序、二代测序或者三代测序完成的基因组,但是未组装到染色体水平均可;

2)基因组未知物种,Hi-C与常规de novo结合提高基因组组装水平。

3. 组装效果

表1 Hi-C辅助组装结果统计[1]

4. 技术优势

1) Hi-C判定scaffolds 的相对位置,具有更高覆盖率和特异性

Hi-C获得的reads长度是一般遗传标记的4-5 倍,使其定位具有更高的位点特异性。此外,Hi-C能获取全基因组所有的scaffolds片段的相互作用信息,因此绝大部分scaffolds都能被组装。

2)结果更加直接、可靠标题此方法基于单一株系Hi-C结果,利用scaffolds 在体内染色质相互作用的分布特征来判定染色体片段之间的邻接关系,比利用亲本后代遗传连锁交互的组装方法更为直接和可靠。
3)适用于多年生高杂合物种

对于杂合度较高的多年生物种如杨树、楸树等,群体的构建具有很大的困难,限制了基于遗传连锁图谱挂载scaffolds的可行性、精度和准确性。此时,Hi-C技术是最佳选择[2]。

4)周期短、成本低、高性价比标题

无需构建遗传图谱,避免了繁琐的群体构建工作,在极大程度上减少了实验误差、系统偏差及机械混杂等不可控因素的干扰。无需进行大规模的基因型分析工作。相比之下,Hi-C 技术实验周期短、实验规模小,节约了时间和成本,性价比极高。

二、Hi-C构建单体型图谱

单体型是指位于一条染色体特定区域的一组相互关联,并倾向于以整体遗传给后代的单核苷酸多态性的组合。简单地说就是同源染色体上同一位点的杂合SNP,如在某一位置同源染色体中一条为G,另一条染色体为A。单体型图谱能够将来自于父母本的遗传信息区分开,研究遗传变异;由多个国家联合进行的国际人类基因组单体型图计划(简称HapMap计划),目标是构建人类DNA序列中多态位点的常见模式,即单体型图(haplotype mapping),简称HapMap。

图3 人类基因组单体型图计划

1.技术原理

通过寻找杂合SNP位点,根据Hi-C中相互作用强度随着距离增大递减的规律,将同源染色体之间SNP位点进行分类,分成两套单体型图谱;每套单体型图谱中依然根据图4规律完成图谱组装与搭建。

图4 Hi-C构建单体型图谱的原理[2]

2. 单体型图谱的意义

获得个体的单体型图谱有以下几方面的意义:

1)单体型图谱用于预测器官移植中捐赠者和接受者的配型效果,也逐渐成为一种检测相关疾病的方法。单体型图谱对于促进个体化医疗发展是至关重要的。

2)在杂合基因中,单体型图谱可以提供信息来判定两个有害突变是否位于相同的等位基因,从而预测这些突变遗传是否有害的。

3)群体的单体型图谱为种群结构和进化历史研究提供了信息。

4)基因表达中的大规模等位基因失衡表明等位基因间的遗传或者表观差异会产生基因表达量的差异。单体型图谱对于研究导致同源基因失衡突变机制意义重大。

3. 技术优势

1)  相对于全基因组重测序等传统方法,Hi-C无需亲本,且费用较低。

2)  在图谱完整性上远远优于传统方法。

图5 Hi-C构建单体型图谱和传统方法比较(proximityligation =Hi-C)

三、Hi-C辅助宏基因组组装

微生物群落由复杂的生物体组成,其中包含很多未知丰度的未知物种。研究复杂微生物群落一般采用宏基因组的方法,但是标准的文库构建方法(DNA小片段)会忽略掉基因组上的远程互作信息,而且传统的宏基因组测序中组装获得的contigs长度较短,往往不能拼接组装到单菌株水平。Hi-C技术可以获取染色体水平的相互作用图谱,提供了细胞内基因组完整的互作信息,包含染色体之内和染色体之间的相互作用信息。通过不同contigs互作的强弱关系,可以将其定位到染色体水平,因此Hi-C可以用于复杂样品中微生物基因组的组装。

1. 技术原理

Hi-C辅助组装的理论依据:根据Hi-C中相互作用强度随着距离增大递减的规律(图6)。大体分为两步:

1)  将宏基因组组装草图中的contigs进行聚类,分为几个菌种。

2)  聚类后,对每个菌种组装成染色体水平的scaffold。

图 6 Hi-C辅助宏基因组组装的原理[3]

2.技术优势

1)改善contigs拼接组装的长度,提高功能基因注释的准确性。

2)将微生物基因组组装到单菌株水平,从而发掘新物种信息。

四、Hi-C解析生物体性状形成机制

随着Hi-C技术的发展,Hi-C技术除了辅助基因组组装、构建单体型图谱和辅助宏基因组组装等应用外,其被广泛地应用于解决生物学问题,即通过研究染色质三维结构信息来揭示生物学机制,例如生物生长发育调控机制、疾病发生发展的重要机制等。

1. 研究染色体区域的相互作用

图7 人染色体之间相互作用热图(安诺数据)

图8 拟南芥染色体之间相互作用Circle图(安诺数据)

2. 研究染色体特殊结构

图9 乳腺癌中活跃区室、非活跃区室(Compartment A/B)区分[4]

图10 衰老细胞中的拓扑结构域(TAD)特征[5]

3. 构建基因组三维折叠模型

图11 酵母染色体3D模型(安诺数据)

图12 拟南芥染色体3D模型(安诺数据)

4.解析调控元件与目标基因的作用模式

图13 Hi-C分析畸形的分子调控机制[6]

图14 Hi-C与ChIP-seq联合分析[7]

五、安诺基因Hi-C优势

1. 领先的建库技术

安诺基因研发团队对Hi-C技术整个建库测序流程进行优化,自环比例可低至1%左右,显著提高了建库成功率;同时,对现有植物Hi-C建库方法进行多种优化,突破植物Hi-C建库难关,最终成功提高了植物Hi-C有效数据比例,领先国际水平。

表1 安诺植物Hi-C与已发表文章数据比较

2. 自主研发Hi-C分析软件

安诺基因与法国居里研究所Edith Heard研究员及Hi-C技术发明人Job Dekker教授共同研发出Hi-C数据处理及可视化软件:HiC-Pro、HiTC。

3.丰富的项目经验

安诺基因与法国居里研究所、北医三院、中国科学院、中国农业科研院等多所科研院所已有丰富的Hi-C合作经验,参与了多项研究工作。 Hi-C物种经验囊括整个生物界,包含动植物及微生物:人、小鼠、猴、蚕、牛、鸡、猪、拟南芥、水稻、玉米、小麦、真菌等;项目经验涵盖人、小鼠细胞发育机制研究,癌症发生机理研究,经济作物优良性状研究,Hi-C辅助农作物基因组组装研究等多个领域。

4. 高分文章成果

安诺基因与法国居里研究所的Hi-C合作项目已发表文章3篇,此外与其他单位的合作项目亦有几个处于文章撰写与发表阶段。

表2 安诺基因Hi-C成果

5. 定制化信息分析

安诺基因信息分析团队除提供Hi-C标准信息分析外,注重与RNA-Seq、ChIP-Seq和甲基化等进行多组学联合分析。通过与合作伙伴共同研究探讨,针对不同项目制定个性化的信息分析方案,保证结果的创新性和可靠性。

参考文献:

[1] Burton JN, Adey A, Patwardhan R P, et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions[J]. Nature Biotechnology, 2013, 31(12): 1119-1125.

[2] Selvaraj S, Dixon J R, Bansal V, et al. Whole-genome haplotype reconstruction using proximity-ligation and shotgun sequencing[J]. Nature Biotechnology, 2013, 31(12): 1111-8.

[3] Burton J N, Liachko I, Dunham M J, et al. Species-level deconvolution of metagenome assemblies with Hi-C based contact probability maps[J]. G3-Genes Genomes Genetics, 2014, 4(7): 1339-1346.

[4] Geeven G, Zhu Y, Kim B J, et al. Local compartment changes and regulatory landscape alterations in histone H1-depleted cells[J]. Genome Biology, 2015, 16(1): 1-15.

[5] Chandra T, Ewels P A, Schoenfelder S, et al. Global reorganization of the nuclear landscape in senescent cells[J]. Cell Reports, 2015, 10(4): 471–483.

[6] Lupiáñez D G, Kraft K, Heinrich V, et al. Disruptions of topological chromatin domains cause pathogenic rewiring of gene-enhancer interactions[J]. Cell, 2015, 161(5): 1012–1025.

[7] Jin F, Li Y, Dixon J R, et al. A high-resolution map of the three-dimensional chromatin interactome in human cells[J]. Nature, 2013, 503(7475): 290-294.

具体详情请查询www.genome.cn。

(0)

热评文章

发表评论