使用python批量计算表型数据数量、平均值、标准差、最小值、最大值

 1.表型数据文件格式(有列名)

2.具体步骤

2.1 运行环境

window环境下安装Git和Python(Linux中安装过python亦可)

表型数据文件夹下鼠标右键打开Git Bash Here

输入python py.py,回车

 2.2 py.py代码

import pandas as pd

# 读取数据
df = pd.read_csv('phenotype_DD.txt', sep='\t', na_values=['NA'])

# 统计数量
count_df = df.count()

# 计算平均值
mean_df = df.mean()

# 计算最小值
min_df = df.min()

# 计算最大值
max_df = df.max()

# 计算标准差
std_df = df.std()

# 计算变异系数
cv_df = std_df / mean_df * 100  # 变异系数 = (标准差 / 平均值) * 100,以百分比表示

# 将结果合并为一个DataFrame
result_df = pd.concat([count_df, mean_df, min_df, max_df, std_df, cv_df], axis=1)
result_df.columns = ['Count', 'Mean', 'Min', 'Max', 'StdDev', 'Coefficient of Variation']

# 将结果写入新文件
result_df.to_csv('summary_stats.txt', sep='\t')

 3. 结果文件summary_stats.txt

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值