基因组学

生物信息学进展和产业前景

YOCSEF 长沙举办 生物信息学研究最新进展 的学术论坛

  生物信息学(Bioinformatics) 是一门新兴的交叉学科,是生命科学领域中的新兴学科,面对人类基因组计划所产生的庞大的分子生物学信息,生物信息学的重要性将越来越突出,它无疑将会为生命科学的研究带来革命性的变革。生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学,它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学()和蛋白学(Proteomics)两方面。

  2005年10月29日下午, YOCSEF长沙在长沙国防科技大学计算机学院学术报告厅举行主题为 生物信息学研究最新进展 的学术论坛,这是YOCSEF长沙本年度举行的第三次活动。会议邀请了美国俄亥俄州立大学生物信息学系博士生导师苑波博士、和国防科技大学教授骆志刚博士进行特邀演讲,国防科技大学教授、CCF软件工程专委会副主任、YOCSEF长沙学术委员会委员王戟博士和国防科技大学教授、YOCSEF长沙学术委员会主席王意洁博士担任论坛的主持。

  苑波博士现任美国俄亥俄州立大学生物信息学系博士生导师,并兼任该校功能基因组研究所所长,国防科技大学计算机学院兼职教授。苑波教授的研究方向包括系统复杂性的演化,基因网络的功能多样性和稳定性,蛋白质三维结构和相互作用预测,生物信息学算法,全基因组功能分析,以及机器学习、并行计算等方法的应用。2001年,苑波教授领导的实验室是人类基因组国际计划和Celera公司之后,全世界第三家完成人类基因组破译和全功能分析的单位。2002年十月获全美杰出青年科学家奖提名。

  苑波博士做了题为 Structural modeling of protein sequences 的报告。近年来的研究表明,在细菌这样的微生物中,非编码蛋白质的区域只占整个基因组序列的10%到20%。随着生物的进化,非编码区越来越多,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分。这表明:这些非编码序列必定具有重要的生物功能。普遍的认识是,它们与基因的表达调控有关。对人类基因组来说,迄今为止,人们真正掌握规律的只有DNA上的编码蛋白质的区域(基因),最新资料说明这部分序列只占基因组的1.1%。仅占人类基因组1.1%的编码区的相关研究已经缔造了数十名诺贝尔奖获得者,98%非编码区蕴含的成果数量将是十分可观的,因此寻找这些区域的编码特征、信息调节与表达规律是未来相当长时间内的热点课题,是取得重要成果的源泉。

  骆志刚博士做了题为 Biological system and its organization 的报告。生物信息学的研究结果不仅具有重要的理论价值,也可直接应用到工农业生产和医疗实践当中去。因此,生物信息学相关的分析与应用算法、软件和数据库,都具有重要的经济价值,最终都会形成商品,提供经济和社会效益。这主要包括疾病相关的基因信息及相关算法和软件开发、建立与动、植物良种繁育相关的基因组数据库、研究与发展药物设计软件和基于生物信息的分子生物学技术等方面。生物信息学的发展,不仅导致生物学、物理学、数学、计算机科学等多种科学文化的融合,也必将造就一批新的从事交叉学科研究的科学工作者。科学家们普遍相信本世纪最初的若干年是人类基因组研究取得辉煌成果的时代,也是它创造巨大的经济效益和社会效益的时代。

  论坛围绕非编码基因的结构和功能分析、遗传变异揭示的生物复杂性和进化、蛋白质序列的结构模型、生物和基因交互网络系统以及生物系统及组织等几个方面展开学术讨论。

  广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。具体来讲,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。生物信息学利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。

  近几年来,随着基因组序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈。首先发现同一种群基于不同分子序列所重构出的进化树可能不同。同时,对 垂直进化 和 水平演化 之间关系的讨论正逐渐引起人们的重视。也就是近年来发现了基因的 横向迁移现象 。如果以人的这些基因序列来研究进化将会得到荒谬的结论。所以在当前的分子进化研究中必须选择垂直进化的分子作为样本。特别是:在分子进化分析中, 相似性 和 同源性 是两个不同的概念。相似性只反映两者类似,并不包含任何与进化相关的暗示。同源性则是与共同祖先相关的相似性。

  系统生物学的核心是建模,利用现有的知识建立一个最适合生物体的模型。建模之前需要确定研究对象。由于生物体的复杂性,通常将研究对象分为三种网络:代谢网络,蛋白质作用网络和调控网络。这三种生物网络并不是独立的,而是相互重叠,相互作用影响的。其中最适合研究的是调控网络。代谢网络最为基础,也就最保守。尽管不同物种代谢网络差别可能很大,但生物多样性的主要原因还是在调控网络和蛋白质相互作用网络上。由于蛋白质相互作用网络更加复杂,所以目前的研究热点在调控网络上。

  从事生物信息学研究应具备多方面的科学基础:需要一定的计算能力,包括相应的软、硬设备;需要强有力的创新算法和软件;要与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。因此,从事生物信息学研究的人员也必须具备多学科交叉的知识。我国生物信息学的研究和应用有一定的基础,因而有望取得突破性成果,这对于增强我国在基础研究领域的实力,在某些方面占据国际领先地位是十分重要的。生物信息学成果的应用也会产生巨大的社会效益和经济效益。

(YOCSEF长沙供稿)







(0)

热评文章

发表评论