基因组学

使用 L_RNA_scaffolder 进行转录组序列对基因组序列的 rescaffolding

  • 2
  • 1,820

1. L_RNA_scaffolder简介

L_RNA_scaffolder能利用长的转录子序列来辅助基因组的scaffolding拼接。这些长的转录子序列可以是454/sanger/Ion_Torrent的测序结果,也可以是illumina测序的de novo组装结果。

在使用此软件进行scaffolding之前,需要将这些长的转录子序列使用BLAT软件map到基因组上,得到PSL(without heading)文件。将此PSL文件和基因组的初步组装结果文件输入到L_RNA_scaffolder,很快能得到结果文件。

2. L_RNA_scaffolder的安装

$ wget http://www.fishbrowser.org/software/L_RNA_scaffolder/downloads/L_RNA_scaffolder.tar.gz
$ tar zxf L_RNA_scaffolder.tar.gz
$ cd L_RNA_scaffolder

运行软件的主程序,不加参数给出帮助信息

$ ./L_RNA_scaffolder.sh

3. L_RNA_scaffolder的使用

先使用blat,将转录子序列比对到基因组

$ blat genome.fasta transcripts.fasta -noHead out.psl

再使用L_RNA_scaffolder.sh得到最终的基因组文件

$ mkdir L_RNA_scaffolder_output
$ /opt/biosoft/L_RNA_scaffolder/L_RNA_scaffolder.sh -d /opt/biosoft/L_RNA_scaffolder/ -i out.psl -j genome.fasta -o ./L_RNA_scaffolder_output

最终的结果文件为./L_RNA_scaffolder_output/L_RNA_scaffolder.fasta

原文http://www.chenlianfu.com/?p=2124

(0)

热评文章

发表评论