perl生物信息
澜澜学编程
这个作者很懒,什么都没留下…
展开
-
一个处理fasta标题的小程序
问题:有一个fasta文件,其中>后面只有名字,现在要依据另外一个txt文件将附属说明添加到对应名字中。解决:用perl很方便的可以解决。思路:1、先打开txt文件,读取关键字和附加说明。2、再打开fasta文件,将关键字和>后面的名字对比。如果相同就将附加说明添加上去。并将其后面的序列重新写入新的文件中。这一块用了flag标识。0代表未匹配状态,1代表已经匹配,2代表链接完后原创 2015-03-04 10:44:48 · 489 阅读 · 0 评论 -
针对blast特定案例下批量处理程序
问题为:首先数据源是已经处理掉引物并且拼接好的单条碱基。需要通过BLAST比对得到其Features是否属于特定蛋白质?BlAST比对采用perl连接远程BLAST从而进行批量比对。首先对数据源处理将所有数据放到一个FASTA文件中。#!/usr/bin/perluse strict;use Bio::SeqIO;use Getopt::Long;my $dirna原创 2015-02-07 01:47:48 · 500 阅读 · 0 评论 -
通过GeneId在NCBI上批量搜寻序列
当你有大批量的GeneId序列的时候,手动一个个在NCBI里面比对肯定是不现实的,本来有Batch Entrez方便批量比对,可是总容易不允许进入。所以写了以下一种流程可以批量比对。首先如果是比对蛋白质(protein)或者(nucleotide)数据库 ,那很容易 用perl以下代码即可。#!/usr/bin/perl -wuse Bio::SeqIO;use Bio::DB::Ge原创 2015-04-06 11:11:58 · 2108 阅读 · 0 评论