perl
文章平均质量分 88
tangxc10
这个作者很懒,什么都没留下…
展开
-
提取最长转录本的代码
1.最长转录本:就是gene的id相同,但是序列的长度不一样,应该挑选出序列最长作为后面的分析下面就是一个转录本的id文件,都是来自同一个gene,但是转录本的id和长度均不相同分析:发现除了第4列表示的基因id相同以外,其他的列均不相同。2.过滤最长转录本的编程思路: 考虑到绵羊的转录本的id的复杂性,主要按一下几个步骤来实现:step1: 读取转录本原创 2015-08-09 19:19:18 · 8678 阅读 · 0 评论 -
如何统计id很复杂的fasta文件的长度?
对于一般的fasta文件的格式是:>chr1AAGCCATCCGG但是最近两天遇到id很复杂的fasta,对于这样的fa文件用现有的脚本却统计错误原本人的hg38染色体有23条染色体,但是统计出来却只有一条染色体的长度:因此,需要重新修改length.pl原创 2015-08-04 15:19:13 · 1884 阅读 · 0 评论 -
[python项目一]查找输出fasta序列的gap的起始终止等信息
一、需要实现的程序内容及输出:对于输入的fasta序列,编写程序查找里面N的起始,终止位置等信息,如下面的染色体test.fa序列为例:>1 dna_sm:chromosome chromosome:UMD3.1:1:1:158337067:1 REFaaattagacactgaagagacttggaaagagaggaagtcaaataacaaagaagaggaaaccaaaagg原创 2015-10-08 10:56:17 · 2680 阅读 · 0 评论