import pandas as pd
# 读取表达量矩阵文件和映射文件
f_matrix = pd.read_csv(r"G:\linux_zky\mapping后分析\fpkm_matrix.csv")
map_file = pd.read_csv(r"G:\linux_zky\mapping后分析\genesNames_id.csv")
# 使用 merge 函数根据 'Gene Name' 列合并两个 DataFrame
mapped = pd.merge(f_matrix, map_file,left_on="gene_name",right_on="gene_name", how='inner')
#把最后一列移动到第一列
mapped = mapped.iloc[:, [-1] + list(range(mapped.shape[1]-1))]
# 删除第二列
mapped = mapped.drop(mapped.columns[1], axis=1)
#检查是否有没匹配到的
# print(mapped[mapped['gene_id'].isna()])
# 保存合并后的结果到新的 CSV 文件
f_newMatrix = r"G:\linux_zky\mapping后分析\newFpkmMatrix.csv"
mapped.to_csv(f_newMatrix, index=False)
#gene_count文件
# f_count = pd.read_csv(r"G:\linux_zky\mapping后分析\preDEdata\gene_count_2.csv")
pd.merge操作记录
最新推荐文章于 2024-07-01 22:12:07 发布