蛋白质组学

双向电泳与蛋白质组学——数据库与工具

常见蛋白质数据库

NCBInr
(National Center for Biotechnology Information,美国国立生物技术信息中心. ) 全球最有影响的生物学网站之一。提供综合的、混合数据库(非单一,non-identical)的蛋白和核酸数据库。包括GenBank CDS 翻译库(GenBank CDS translation)、PIR、SWISS-PRO、PRF和PDB。NCBI为了避免重复,花费了很大精力为这些数据库里的序列提供了相互参照引用。提供PubMed、Entrez、BLAST、OMIM、Taxonomy、Structure等工具,可对国际分子数据库和文献进行检索、搜索和分析。NCBI成立于1988年,宗旨是更好地理解那些影响人类健康和疾病的分子过程。
GenBank
NIH基因序列数据库,并且给所有公开获得的DNA序列进行了注解。已经有大约15,465,000 序列,包含17,089,000,000 个碱基(2002.02)。

dbESTGenBank的一部分,它包含了许多物种的cDNA序列或者“表达的序列标签(Expressed Sequence Tags,ESTs)。

Swiss-Prot
一个经过整理后的蛋白质序列数据库,它致力于提供一个高水平的注释(例如描述蛋白质的功能、作用域结构、翻译后修饰、突变体等)、最低水平的冗余以及与其它数据库的整合。建立于1986年,从1987年开始与日内瓦大学以及EMBL数据实验室(EMBL Data Library,欧洲生物信息学学会)共同维护。TREMBL
(欧洲分子生物学实验室)对Swiss-Prot 蛋白质序列数据库的增补,含有EMBL 核酸序列数据库中尚未出现于Swiss-Prot 的所有编码区(CDS)的翻译序列。

PIR
蛋白质信息资源(Protein Information Resource,PIR)数据库是由National Biomedical Research Foundation (NBRF)创立,收集的序列用来研究蛋白质在进化中的关系。数据库现在已经和其它3个数据中心建立了国际联盟:NBRF、慕尼黑蛋白质序列信息中心和日本国际蛋白质信息数据库,这3个中心共同制作和发布一个“野生型(wild-type)”蛋白质序列数据库。

MSDB
由伦敦皇家学院(Imperial College London)Hammersmith分校的蛋白质组学系负责维护、基于质谱应用的数据库。属于混合数据库(非单一,non-identical)。

PDB
(Protein Data Bank) 美国国家实验室(Brookhaven National Laboratory,BNL)蛋白结构数据库。同时提供蛋白质序列及其三维空间晶体学原子坐标.其中受体-配体、抗原-抗体、底物-酶复合物等相互作用分子的共结晶图谱是基于同源比较的分子设计所需的最佳模型。

EMBL
核苷酸序列数据库(European Molecular Biology Laboratory)一个DNA和RNA序列综合性的数据库,它的数据是从科学文献和专利申请中收集而来,是由研究人员和测序工作组直接提交的。数据的收集工作是和GenBank以及日本DNA数据库(DDBJ)合作进行的。

PROSITE
蛋白质家族和功能域数据库。包含大量具有生物学意义的位点、模型等信息。

Predictome蛋白质功能联系预测数据库。研究蛋白质之间的功能关联和相互作用是蛋白质学的研究重点,为44个基因组的蛋白之间的功能联系提供预测。采用三种关联方法(gene fusion, chromosomal proximity, gene co-evolution),实验包括yeast two-hybrid, immuno-coprecipitation, correlated expression。

常见双向电泳数据库

WISS-2DPAGE
858个蛋白质,33块胶,包含:human, mouse, Arabidopsis thaliana, Dictyostelium discoideum, Escherichia coli and Saccharomyces cerevisiae.13-Aug-2002。SIENA-2DPAGE70个蛋白质。最近更新:23-Jun-2000。GelBankANL(Argonne National Laboratory)双向电泳胶数据库。由美国能源部投资建设,芝加哥大学管理。现有100多块电泳胶。Human 2D PAGEDanish Centre for Human Genome Research。HEART-2DPAGEWittmann Institute of Technology and Analysis of Biomolecules and at the Free University of Berlin. from ventricle or atrium of human heart。RAT HEART-2DPAGEMax-Planck-Institute for Infection Biology. German Heart Institute Berlin. 最近更新:20-Dec-2001。

HSC-2DPAGEHarefield Hospital. Protein Biochemistry Group..Heart Science Centre. Human Heart (Ventricle) (27 Feb 98);Human endothelial cell (EA.hy 926) (6 Feb 97);Rat Heart (Ventricle) (15 Aug 97);Dog heart (ventricle) (3 Oct 97)。

YPM Yeast410个蛋白质被鉴定,对应282个不同的基因。 10 Nov 2000。

PHCI-2DPAGEParasite host cell interaction。

Cyano2Dbase234个蛋白质,日本。

BPP-2DPAGE12 maps. hemapopoietic cell lines. 15-Nov-2001。

HSC13 gels. Hematopoietic Stem Cells (HSC)。

常用蛋白质组分析网站与工具

ExPASy(Expert Protein Analysis System,蛋白质分析专家系统)位于瑞士,专门分析蛋白质序列、结构、功能和蛋白质2D-PAGE图谱。设有SWISS-PROT、TrEMBL、PROSITE、SWISS-2DPAGE、SWISS-3DIMAGE、ENZYME等数据库和AMOS生物学书签、SWISS-MODEL等工具。

EBI(欧洲生物信息学研究所)由欧共体资助的生物信息学网站,开发EMBL、TrEMBL、SWISS-PROT等数据库,提供SRS、FASTA、WU-BLAST、CLUSTAL等工具,分布多种生物学信息专栏。

RCSB(结构生物信息学研究联合实验室)研究生物大分子三维结构,管理PDB、NDB、BMCD等数据库,开发结构分析工具、标准。

HGMP-RC(UK Human Genome Mapping Project Resource Center)提供基因组领域研究的领先工具,包含蛋白质序列、三维结构、基因序列、功能蛋白质与基因、基因组等数十种数据库。其主体研究分部和生物信息学分部设在Hinxton基因组研究园。

ProteinProspector提供大量分析质谱数据的工具,包括MS-Fit,MS-Tag,MS-Seq,MS-Pattern,MS-Homology,MS-Bridge,MS-NonSpecific,以及MS-Fit Batch,MS-Fit Web Batch,MS-Tag Batch,MS-Tag Web Batch批量分析工具。

Mascot基于质谱数据和MOWSE概率算法的蛋白质鉴定系统,具有十分丰富的结果展示与辅助解析功能。数据可为肽质量指纹谱,肽序列、氨基酸组成、子离子,串联质谱原始数据等。

BLAST(Basic Local Alignment Search Tool)一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库和软件工具可以从WWW或FTP来获得。

ProAnWin(蛋白质分析专家)多个蛋白质序列对齐、比较性序列分析,研究蛋白质结构-功能(基因型-属性)关系,设计点突变,找出蛋白质或多肽的活性与分子一级结构或三级结构中某些特征的关系。

roAnalyst为ProAnWin 提供多功能的蛋白质序列和结构分析的扩展模块,它可以搜索motif 、绘制理化关系图、对蛋白质的序列变异进行语义分析和理化分析、绘出结构-活性关系的剖析图等。

大家补充呀!

(0)

热评文章

发表评论