HTSeq-count后产生多个gene表达的count文件,需要合并一下
实际代码
!/usr/bin/python3
def combine_count(count_list): ##定义一个合并的函数
mydict={} #创建字典
for file in count_list: #读取count_list里面的每一个文件
for line in open(file,'r'): #读取每一个文件里面的每一行
#print(line)
if line.startswith('E'): #判断是不是每行的开头都是E
key,value = line.strip().split('\t') #读取文件内容到新的字典里; \t 是制表符; split('\t)是去除制表符;strip()是去除字符串头尾的空格以及 \n, \t之类的
if key in mydict:
mydict[key]=mydict[key] + '\t' + value # 追加值
else:
mydict[key]=value # 更新key的内容
sorted_mydict = sorted(mydict) #排序
out = open('count_out.txt','w') #open创建一个新的空文件
for k in sorted_mydict:
#print(k,mydict[k])
#break
out.write(k+'\t'+mydict[k]+'\n') # 写入已经排好序的内容
count_list=['SRR3589956.count', 'SRR3589957.count', 'SRR3589958.count']
combine_count(count_list)