perl
xflee0608
这个作者很懒,什么都没留下…
展开
-
利用perl或者R实现不规则文本的行列转置
如下是一个不规则的文本(行列中有空缺位),将其行列转置,求新的文本。Array.lst:1 aa bb cc dd2 re uy oo jj3 uh njk kjh jll4 bgjkh klllj hhgj k原创 2014-08-08 14:34:44 · 2717 阅读 · 0 评论 -
根据ID列表提取fasta序列
根据基因列表,从总的fasta文件中提取原创 2014-08-08 17:45:09 · 12359 阅读 · 3 评论 -
用一个简单的perl包轻松管理脚本中的软件调用
在用perl写的流程中,有人喜欢直接在脚本定义软件的路径,比如:my $blastall="/opt/blc/genome/bin/blastall";这样做,看着好像很省事的样子,但是当一个流程层次关系比较复杂时,而且当其中的路径失效时,麻烦来了:我们需要翻复杂的脚本,重新找到标量的定义,然后修改之。可是,当你把所有调用的软件路径写到配置文件中,并用perl package func原创 2014-08-17 23:22:32 · 2450 阅读 · 0 评论 -
从cds到pep
鉴于有几位同学在问如何批量转化cds为pep序列,那么本人就把自己的一段代码从另一个脚本中抽取出来。故意写成两个子函数是方面单独使用,比如输入序列不是单纯的fasta格式而是phy格式的,可以对cds2pep函数做一下调整,code子函数则无需改动。这段代码要求的输入文件格式是fasta。用法:perl cds2pep.pl input.cds.fa out.pep.fa #!原创 2014-08-29 21:39:52 · 5059 阅读 · 1 评论 -
从NCBI基因组数据中获得cds,pep和geneID对应表
A perl script deal with ncbi raw data,and from which get cds ,pep and gene,mRNA and protein ID list.原创 2014-08-08 16:52:34 · 15470 阅读 · 0 评论 -
perl一次读取多行文本的策略
在处理文本时,常常遇到这样的情况:就是我们需要把两行文本做一个比较,然后选择性输出。而在while(){do something}程序块中默认只能一次读取一行。笔者在这里,举一个简单的例子来说明怎么处理这种情况。有一个这样一段文本:a 1 2 3 4a 5 6 7 8a 6 7 8 9a 7 8 9 11a 7 8 9 12a 13 12 14 15a 18 14原创 2014-08-09 23:38:38 · 5404 阅读 · 0 评论 -
从gtf到gff
从Ensemble数据库中下载到的基因组坐标文件通常是原创 2014-08-08 17:04:00 · 3958 阅读 · 0 评论 -
随机抽取一定比例的fastq文件
在NGS的下机数据中,我们通常抽取一些fq文件,做原创 2014-08-08 17:27:18 · 4436 阅读 · 0 评论 -
数字之美
这是一个实现多种特征数筛选的perl脚本,有点意思。原创 2014-08-08 15:44:58 · 700 阅读 · 0 评论 -
利用施瓦茨排序获得范围数据的并集
有一个文件gi.txt是这样的:abc 38449 25480-25548 25189-25245abc 24548 6408-6446abc 209928 28985-29312 29715-29736abc 396277 205294-205311 394789-394806abc 290118 77原创 2014-08-08 14:54:11 · 629 阅读 · 0 评论 -
切割fasta文件的几种方案
在做blast,muscle等比对时,对于一个较大的fasta原创 2014-08-08 18:06:54 · 8497 阅读 · 2 评论 -
快速获取两组数据的交集,并集,补集
笔者常用这个脚本快速查看两组数据的交原创 2014-08-08 17:36:47 · 4654 阅读 · 0 评论 -
滑窗口统计基因组GC含量的分布
在基因组学常规分析中,滑统计GC含量是一个原创 2014-08-08 17:09:31 · 8011 阅读 · 1 评论 -
在命令行获取标准输入序列的反互序列,pep序列和长度信息
最近对序列文件处理的比较多,时常要看一些核酸序列的反向互补序列,长度,可能的翻译序列。以前我常常使用seqBuider 来查看,如果能在命令行直接查看,想必是极好的。这是一个perl脚本,不过我把它的执行路径写入环境变量后,就可以当linux命令直接使用了,很方便的。这个脚本有四个参数。【-i -r -p -l 】其中-i 是必要的参数,用来接收标准输入;-r 是获得一段序列的原创 2014-09-30 10:21:46 · 1538 阅读 · 0 评论