awk
tangxc10
这个作者很懒,什么都没留下…
展开
-
提取最长转录本的代码
1.最长转录本:就是gene的id相同,但是序列的长度不一样,应该挑选出序列最长作为后面的分析下面就是一个转录本的id文件,都是来自同一个gene,但是转录本的id和长度均不相同分析:发现除了第4列表示的基因id相同以外,其他的列均不相同。2.过滤最长转录本的编程思路: 考虑到绵羊的转录本的id的复杂性,主要按一下几个步骤来实现:step1: 读取转录本原创 2015-08-09 19:19:18 · 8613 阅读 · 0 评论 -
如何用awk过滤最后一行的?
最近需要对fasta文件的id进行处理,输入的ID格式如下:而我要处理成:也就是过滤文件的最后一列,目前过滤文件的最后一列的方法有如下:(1) awk '{print $1"\t"$2"\t"$3"\t"$4"\t"$5}' 解析:因为该文件有六列,过滤最后一列也就是只打印前五列,但是存在的问题是:awk打印出来的第一列和第二列之间的空格数对应不起来(2原创 2015-08-09 17:51:39 · 8979 阅读 · 1 评论 -
【转】正则表达式 文本处理三剑客的总结
0 正则表达式的基础^ 行首标识$ 篇尾标识或行尾标识. 代表任意一个字符? 代表前趋字符的一次出现* 代表0个或多个前趋字符出现[1-9] 代表一个属于1-9的字符[^1-9]转载 2015-08-18 15:07:56 · 458 阅读 · 0 评论