gffread 常用使用自己速记

gffread gff3文件 -g 基因组文件 -x cds文件 -y pep 文件

gffread gff3文件 -T -o gtf文件
gffread gtf文件 -o gff文件

大家常见的-o- 是 指定输出打印到屏幕,所以也可以写成
gffread gtf文件 -o- > gff文件


今天gffread 翻译后的蛋白投入 orthofinder 发现 orthofinder 在调用diamond报错,错误内容是无法识别 “.“字符,这是因为gffread 把stop codon翻译为”.”(dot),而不是我们使用mega时候的""(asterisk)。
gffread 可以在使用-y pep 时候 -S "
" 指定终止密码子为"*" ,但是作者在github写So ugly. 人们为什么看到星号不是通配符?他就觉得很丑。

我呢懒得重新翻译了,所以就写了一个小脚本更改一下:

stop_codon_replace.py

import sys


def replace(infile):
    with open(infile) as fi:
        for line in fi:
            line = line.strip()
            if line.startswith(">"):
                print(line)
            else:   
                if "." in line:
                    line = line.replace(".","*")
                    print(line)
                else:
                    print(line)


if __name__ == "__main__":
    replace(sys.argv[1])

然后 for循环就好了
for i in *pep; do python stop_codon_replace.py $i> $(basename $i).change ; done

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值