对有重复的结果筛选

结果每三个为一个重复,选择其中两个差距小的平均
数据如下
在这里插入图片描述

"""
author: shuaijie
intro: 在三个测氮的值中选择两个相近的平均
date: 07/27/2020 11:28
"""
import pandas as pd


def main():
    fp = pd.read_excel(r'C:\Users\admire\Desktop\测氮结果示例.xlsx')  # 读取数据
    result = []
    identify = []
    for i in range(int(len(fp)/3)):
        std1 = (fp.iloc[i*3, 1] - fp.iloc[i*3+1, 1])**2
        std2 = (fp.iloc[i*3, 1] - fp.iloc[i*3+2, 1])**2
        std3 = (fp.iloc[i*3+2, 1] - fp.iloc[i*3+1, 1])**2  # 计算方差
        if min(std1, std2, std3) == std1:  # 选择方差小的两个值
            result.append((fp.iloc[i*3, 1] + fp.iloc[i*3+1, 1])/2)
        elif min(std1, std2, std3) == std2:
            result.append((fp.iloc[i*3, 1] + fp.iloc[i*3+2, 1])/2)
        else:
            result.append((fp.iloc[i*3+2, 1] + fp.iloc[i*3+1, 1])/2)
        identify.append(i)
        identify.append(i)
        identify.append(i)  # 定义位置三个一组,计算原始方差和均值
    fp.insert(0, 'ID', identify)
    data_mean = fp.groupby(by='ID').mean()
    data_std = fp.groupby(by='ID').std()
    final_data = pd.merge(data_mean, data_std, on='ID', how='left')
    final_data['最终值'] = pd.Series(result)
    final = final_data[['值_x', '值_y', '最终值']]  # 提取需要的值
    final_2 = final.rename(columns={'值_x': '平均', '值_y': '方差'})  # 改变列名
    final_2.to_excel(r'C:\Users\admire\Desktop\测氮结果筛选.xlsx')  # 输出结果


if __name__ == '__main__':
    main()

结部分
部分结果

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值