Python-->提取两个文件中相同样本信息

c1bf369a5246ecfe67f8a36b46da94cf.jpeg

    最近在学习Python,将此语言运用到实践操作中,刚好想利用这个还比较生疏的语言提取两个文件中相同样本信息,A文件格式如下:

2973791b2c77a5e33fb2804c514aaa8e.jpeg

    B文件格式如下:

fa2f60b32e47ec28275b8935493fd946.jpeg

    基本思路:先读取A、B文件,分别存在列表A_list、B_list中,逐一取出A_list中的数据项,检查是否在B_list中,若在则加入最终的列表C_list中。

    第一步:先从A.info.txt、B.risk.txt中提取Sample ID,然后赋给列表A_list、B_list;

         with open(inputfile1,"r") as rf:

              for line in rf:

                  id=line.split('\t').pop(0)

                   A_list.append(id)

            #print A_list

    第二步:逐一取出_list中的数据项,检查是否在B_list中,若在则加入最终的Sample_id:    

           Same_id=[]

         for id in A_list:

                if id in B_list:

                    Same_id.append(id)

      亮点是“if id in B_list:”我们可以用这样简洁的语句实现查询。

 完整代码如下:

 #!/usr/bin/python

 # Filename : GetSameSample.py

 import sys

 import os

 inputfile1 = sys.argv[1]

 inputfile2 = sys.argv[2]

 A_list=[]# get every the whole ids from A_list and B_list,

 with open(inputfile1,"r") as rf:

         for line in rf:

                 id=line.split('\t').pop(0)

                 A_list.append(id)

 #print A_list

 B_list=[]

 with open(inputfile2,"r") as rf:

         for line in rf:

                 id=line.split('\t').pop(0)

                 B_list.append(id)

 #print B_list

 Sample_id=[]# check every id in A_list, to find that wheather is

 for id in A_list:

         if id in B_list:

                 Sample_id.append(id)

 #print Sample_id

 for id in Sample_id:

         print id

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值