蛋白质组学

蛋白质结构数据库PDB介绍

简介


以收集的蛋白质三维结构公共数据为核心,附带核酸、糖类三维结构和各类由 X 射线衍射结晶学家、核磁共振谱分析学家通过实验测定的合成物。

数据年增长概况


rcsb-protein-data

记录格式


PDB 记录包括两个序列信息备份:隐性序列和显性序列。两者都被用于重构生物高聚体的化学图像。显性序列在 PDB 文件中以关键词 SEQRES 打头逐行存储。不同于其它序列数据库,PDB 记录用三字母氨基酸编码,任意选择三个字母作为名称的非标准氨基酸在许多 PDB 记录序列条目中可被找到。在 PDB 中,一些双螺旋核酸序列条目被指定依照在条目中按从 3’到 5’端的顺序排列的一条链在上,从 5’到 3’端排列的互补链在下的方式排列。虽然这些以双螺旋形式表达的序列对人类而言是容易理解的,但直接由计算机阅读此类从 3’到 5’端排列的显性序列是荒堂的。

PDB 记录中的隐性序列蕴涵在由 PDB 文件中的 ATOM 记录及相应(X,Y,Z)位置坐标构成的化学立体结构中。

关于序列的记录


例如:……
SEQRES 1 A 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU
SEQRES 2 A 21 TYR GLN LEU GLU ASN TYR CYS ASN
SEQRES 1 B 30 PHE VAL ASN GLN HIS LEU CYS GLY SER HIS LEU VAL GLU
SEQRES 2 B 30 ALA LEU TYR LEU VAL CYS GLY GLU ARG GLY PHE PHE TYR
SEQRES 3 B 30 THR PRO LYS ALA
SEQRES 1 C 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU
SEQRES 2 C 21 TYR GLN LEU GLU ASN TYR CYS ASN
……
在同一蛋白质中,分多条链进行记录。

关于 Helix 的记录


例如:……
HELIX 1 HA GLY A 86 GLY A 94 1 9
HELIX 2 HB GLY B 86 GLY B 94 1 9
……
Helix 记录指明 Helix 在蛋白质中的位置。记录中标明 Helix 的名字,并且对
之进行编号。Helix 的起始与终止位置被标明,同时还标出其长度。

关于 Sheet 的记录


例如:……
SHEET 1 A 5 THR A 107 ARG A 110 0
SHEET 2 A 5 ILE A 96 THR A 99 -1 N LYS A 98 O THR A 107
SHEET 3 A 5 ARG A 87 SER A 91 -1 N LEU A 89 O TYR A 97
SHEET 4 A 5 TRP A 71 ASP A 75 -1 N ALA A 74 O ILE A 88
SHEET 5 A 5 GLY A 52 PHE A 56 -1 N PHE A 56 O TRP A 71
SHEET 1 B 5 THR B 107 ARG B 110 0
SHEET 2 B 5 ILE B 96 THR B 99 -1 N LYS B 98 O THR B 107
……
Sheet 记录指明 Sheet 在蛋白质中的位置。记录中标明 Sheet 的名字,并且对之进行编号。Sheet 的起始与终止位置被标明.

(责任编辑:大汉昆仑王)

(0)

热评文章

发表评论