Igblast

目录

抗体的可变区部分是由多个基因组成,包括V基因、D基因和J基因。分析抗体序列的时候不仅需要鉴别出各个基因的来源也需要比较与胚系基因的差别。常用的软件包括igblast。igblast可以检索到最匹配的V、D、J胚系基因,同时也能够分析出基因重排的细节。igblast能够分析核酸序列以及氨基酸序列。但是由于网站位于国外,所以经常会遇到网络卡顿或者访问被禁的情况,这边我介绍下如何架设本地的igblast。

软件安装

下载

首先到官网下载igblast,再下载数据库,官网只有mouse的mouse_gl_VDJ数据其他种属的需要自己准备。

部署

解压软件,新建database文件夹,将mouse_gl_VDJ下载到database。

将bin目录加到PATH路径里。

export PATH=~/IGBLAST/bin:$PATH

到此,基本已经可以使用igblast来分析mouse的抗体序列了。

igblastn -h

blast

制作human database

到imgt数据库下载Human V/D/J序列。分别下载IGHV、IGHD、IGHJ、IGKV、IGKJ、IGLV和IGLJ。

将V/D/J序列合并成一个文件。

cat IGHV IGKV IGLV >> human_gl_V.imgt
cat IGHD >> human_gl_D.imgt
cat IGHJ IGKJ IGLJ >> human_gl_J.imgt

制作数据库

edit_imgt_file.pl human_gl_V.imgt > human_gl_V
makeblastdb -parse_seqids -dbtype nucl -in human_gl_V
edit_imgt_file.pl human_gl_D.imgt > human_gl_D
makeblastdb -parse_seqids -dbtype nucl -in human_gl_D
edit_imgt_file.pl human_gl_J.imgt > human_gl_J
makeblastdb -parse_seqids -dbtype nucl -in human_gl_J

至此已经完成了human database。

运行

igblastn -germline_db_V database/human_gl_VDJ/human_gl_V -germline_db_J database/human_gl_VDJ/human_gl_J -germline_db_D database/human_gl_VDJ/human_gl_D -organism human -query myseq -show_translation

结果 blast_run 后面就是比对的序列,此处就不展示了。

参考资料

https://ncbi.github.io/igblast/