蛋白质组学

2011年基金申请帮手:文献挖掘分析系统

2011年基金申请已经拉开序幕,如果您还在为无法找到合适的课题而烦恼,如果您还在为如何从浩如烟海的文献中找到您想要的信息而抓狂,文献挖掘分析系统(软件著作权登记号:2009SR045504)可以助您一臂之力。

文献挖掘分析系统主要针对客户提供的一个或一组关键词,利用相关算法从PubMed数据库中查找到与之相关的所有基因或蛋白、小RNA、SNP、化合物等信息,并对这些数据进行网络及功能分析。分析的结果作为研究背景和立项依据写进标书中,可以大大提高标书的中标率。

1.1 用途

该项目是依据某生物公司独立研发的文献挖掘分析系统开展的一项服务,该系统已成功申请了软件著作权,在很多领域进行了应用。该分析用途相当广泛,例如:
1、可以对研究的相关领域有一个宏观了解,是一个一劳永逸的工作。
2、运用于基金申请的项目立项、研究背景,举例说明等方面。有助于提高各类科学基金申请的成功率。
3、分析的基因一般都是专业的明星分子,可以为深入研究提供信息;
4、构建一个宏观的分子线路图,适用于信号通路分析;
5、分析了低通量筛选出来的基因,可以用于和芯片、solexa等数据分析的比较;
6、通过构建基因调控网络,可以揭示目标基因之间的相互作用关系;
7、通过基因功能分析,可以预测一些已知基因的未知功能。

1.2 可靠性
1、对于基因和关键词的关系,是由计算机的相关算法自动处理的结果,我们还提供文章摘要中的关键句子作为佐证。
2、所有涉及的文章的Pubmed ID号、基因别名等信息均存在放附表中,以供客户查阅及验证。
3、基因互作数据取自专业数据库,数据准确可靠。
4、所有的信息都要经过人工的检查,保证数据准确可靠,并具有代表性和完整性。

1.3 项目的内容
针对NCBI里的文献数据库,找到跟目标关键词相关的所有的文章,包括文章的摘要。利用NLP方法从PubMed文献摘要数据库中挖掘出与关键词相关的基因/蛋白/microRNA等,形成与关键词相关的基因/蛋白/miRNA列表,构建基因/蛋白/miRNA调节网络,最后对与关键词相关的基因/蛋白进行功能分析(TF、KO、GO分析等),以寻找已知基因/蛋白的未知功能。关键词可以是“某疾病”,“某基因”等词语,也可以是“A or B”或“A and B”等一组目标词组。

基本流程
1) 文档搜索及格式化,利用关键词进行文档搜索,并将文档整理成XML格式。
2) 利用软件进行基因的描述的定位。
3) 基因符号以NCBI的entrez gene数据库为准。
4) 利用关键词搜索,获得相关文献的摘要。
5) 对于每个基因,统计该基因出现的频率。
6) 提取出相关基因及摘要中提及的语句。
7) 人工核对查证纠错(敏芯公司负责进行初筛,客户进行细筛)。
8) 对筛选的基因进行功能及网络分析

分析结果

1、列表展示:

基因名 匹配的文章数 与目标基因的关系 文章摘要中出现的句子
HNF4A 75 target HNF4A is an target gene with A gene

2、网络构建:

3、功能分析:

(0)

热评文章

发表评论