课题第一天

1. 得到了197个cmv的genbank文件,是一个合并的文件,要使用yanbo的gb2fas.py来进行各个cds的提取,首先需要将这些genbank文件进行拆分。


2. 自己编写了一个简单的biopython脚本来拆分,用这些genbank的描述来对拆分的文件进行命名,结果发现有多个描述完全一样,所以造成了同名文件覆盖,总是缺少一些文件。


3. 同名的文件进行了重新命名,在文件名的结果加上了duplicate关键字,以示区别。通过diff工具进行了鉴别,发现这些同名的文件其内容并不一样,所以都保留了。


4. 在用每个genbank文件的描述来命名时,发现带有"/"的描述不能用来命名,所以将这些"/"都换成了"-"。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值