- 摘要
- 最近优化RNA-seq,在定量环节后,需要汇总各样品的count值生成一份总表,然后转换成FPKM值。之前使用的是组长写的perl脚本,奈何自己实在是看不懂,并且之后为了加入到snakemake流程中也只支持python。于是,今天使用python对这部分进行了重写。
- 环境配置
- python:3.8.5
- 使用代码
-
import re import os import pandas as pd newfile_name = "../02.align/htseq/all_count.txt" newfile = open(newfile_name,'w') all_count = pd.DataFrame() #建立空白数组 for root,dirs,files in os.walk(r"../02.align/htseq/"): #遍历各样品count文档 for file in files: if ".count" in file: #print(os.path.join(root,file)) count_file = pd.read_csv(os.path.join(root,file),delimiter='\t',header=None, usecols=[0, 1]) #以数组形式打开count文档 fi
-
2021.03.30丨使用python提取与合并指定列
最新推荐文章于 2024-04-14 19:00:00 发布