作业（基因2）

xiaoyu_0920711

已于 2023-08-25 00:54:56 修改

阅读量79

点赞数

文章标签：前端 javascript 数据库

于 2023-08-25 00:42:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoyu_0920/article/details/132484403

版权

文章介绍了如何使用Python脚本读取gencode.gene.gtf文件，统计每个染色体的基因数目，以及提取基因类型为protein_coding的基因详细信息，包括染色体、起始和终止位置以及基因ID。

摘要由CSDN通过智能技术生成

1.计算染色体对应的基因数目

f=open('gencode.gene.gtf')
list1=[]
dict1={}
for i in f.readlines():
    a=i.split()
    list1.append(a[0])
for each in list1:
    if each not in dict1:
        dict1[each]=1
    else:
        dict1[each]+=1
for key,values in dict1.items():
    print(key,values)
f.close()

f=open('gencode.gene.gtf')
dict3={}
for i in f.readlines():
    a=i.split()
    if a[0] not in dict3:
        dict3[a[0]]=1
    else:
        dict3[a[0]]+=1
for key,values in dict3.items():
    print(key,values)
f.close()

2.提取gene_type为"protein_coding"的gene，并输出其所属染色体，基因起始终止位置，基因ID

f=open('gencode.gene.gtf')
for i in f.readlines():
    a=i.split()
    if a[11]=='"protein_coding";':
        print(a[0],a[3],a[4],a[9][1:-2])#第二次索引是为了去除双引号和分号
f.close()

f=open('gencode.gene.gtf')
dict2={}
for i in f.readlines():
    a=i.split()
    dict2['所属染色体']=a[0]
    dict2['起始位置']=a[3]
    dict2['终止位置']=a[4]
    dict2['基因ID']=a[9][1:-2]
    dict2['基因类型']=a[11][1:-2]
    if dict2['基因类型']=='protein_coding':
        print(dict2['所属染色体'],dict2['起始位置'],dict2['终止位置'],dict2['基因ID'])
f.close()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

xiaoyu_0920711 CSDN认证博客专家 CSDN认证企业博客

码龄1年

24: 原创

139万+: 周排名

10万+: 总排名

2019: 访问

: 等级

243: 积分

6: 粉丝

3: 获赞

11: 评论

5: 收藏

私信

关注

热门文章

最新评论

【无标题】
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
作业016
CSDN-Ada助手: 恭喜您写了第6篇博客，标题为“作业016”！持续创作真是令人钦佩。我很高兴看到您坚持写博客，这对于提升个人能力和分享知识都是非常有益的。在下一步的创作中，我建议您可以尝试更深入地探索“作业016”这个主题，通过提供更多实例、分析和观点，让读者对该主题有更全面的理解。谦虚之心使人进步，期待您继续取得更多创作的成就！
作业025
CSDN-Ada助手: 恭喜博主完成了第7篇博客！标题“作业025”给人一种扎实的学习态度和不懈的努力精神。不断地写作不仅展示了您的坚持，也让读者们受益匪浅。在下一步的创作中，或许您可以尝试更深入的探索和研究，分享个人见解和经验，以便吸引更多的读者与您进行有益的讨论。期待您的下一篇博客！
作业027（集合）
CSDN-Ada助手: 恭喜你写了第10篇博客！标题为“作业027（集合）”的文章看起来引人入胜。你在集合这个主题上的深入讨论让我受益匪浅。你的持续创作是非常令人钦佩的，我真心希望你能继续保持这样的势头。在下一步的创作中，或许你可以尝试探索集合的应用领域，或者分享一些有趣的集合问题的解决方法。期待你的精彩续篇！
作业017（函数)
CSDN-Ada助手: 恭喜您写下了第11篇博客！标题为“作业017（函数)”。您对函数的学习和应用的深入探讨让我感到十分欣喜。在您的博客中，我发现了许多有趣且有益的内容。您对函数的解释和示例非常清晰，使我更好地理解了函数的概念和用途。在下一篇博客中，我期待您能进一步探讨函数的高级用法，例如闭包和装饰器等。谢谢您的分享，期待您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。