python实现基因表达量FPKM值转化TPM值

xxwang_cc

已于 2023-04-19 14:39:48 修改

阅读量634

点赞数 1

文章标签： python

于 2023-04-19 14:36:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jinccx11211/article/details/130243359

版权

代码：

# 导入所需的包
import os
import pandas as pd

# 设置工作目录输入文件在此目录下，输出文件也会在此目录下输出
os.chdir(r'C:\Users\Desktop')

# 加载包含FPKM值的DataFrame，假设列名为 "id"、"S3"、"S4"、"S5"、"S6"、"S7"、"S8"，分隔符为制表符，运行时根据自己FPKM文件的列名和列数进行修改
df = pd.read_csv("fpkm.csv", sep='\t')

# 计算每个样本的FPKM之和
total_fpkm = df[['S3', 'S4', 'S5', 'S6', 'S7', 'S8']].sum()

# 计算每个基因的TPM值
df['tpm_S3'] = (df['S3'] / total_fpkm['S3']) * 1e6
df['tpm_S4'] = (df['S4'] / total_fpkm['S4']) * 1e6
df['tpm_S5'] = (df['S5'] / total_fpkm['S5']) * 1e6
df['tpm_S6'] = (df['S6'] / total_fpkm['S6']) * 1e6
df['tpm_S7'] = (df['S7'] / total_fpkm['S7']) * 1e6
df['tpm_S8'] = (df['S8'] / total_fpkm['S8']) * 1e6

# 删除原始的FPKM列
df.drop(columns=['S3', 'S4', 'S5', 'S6', 'S7', 'S8'], inplace=True)

# 将转换后的数据输出到tpm.csv文件，使用制表符作为分隔符
df.to_csv("tpm.csv", index=False, sep='\t')

输入文件（基因表达量FPKM）的格式：

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
python实现基因表达量FPKM值转化TPM值

加载包含FPKM值的DataFrame，假设列名为 "id"、"S3"、"S4"、"S5"、"S6"、"S7"、"S8"，分隔符为制表符，运行时根据自己FPKM文件的列名和列数进行修改。# 设置工作目录输入文件在此目录下，输出文件也会在此目录下输出。# 将转换后的数据输出到tpm.csv文件，使用制表符作为分隔符。# 计算每个样本的FPKM之和。# 计算每个基因的TPM值。# 删除原始的FPKM列。
复制链接

扫一扫

xxwang_cc CSDN认证博客专家 CSDN认证企业博客

码龄3年

浙江师范大学

2: 原创

171万+: 周排名

166万+: 总排名

1809: 访问

: 等级

23: 积分

1: 粉丝

3: 获赞

1: 评论

8: 收藏

私信

关注

热门文章

分类专栏

最新评论

python实现基因表达量FPKM值转化TPM值
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python实现基因表达量FPKM值转化TPM值
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614764274。

最新文章

python实现fasta格式转换为phy格式

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。