利用python对一个excel列表.xlsx进行归一化,并且导出归一化后的excel列表

在这里插入图片描述


一、思路如下

我们使用pandas库中的read_excel()方法读入excel文件,使用MinMaxScaler()函数对数据进行归一化处理,然后利用to_excel()方法将结果输出到excel文件中。

二、使用的程序代码

import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 读取excel文件
df = pd.read_excel('input.xlsx')

# 数据归一化
scaler = MinMaxScaler()
df_normalized = scaler.fit_transform(df)

# 转换成DataFrame
df_normalized = pd.DataFrame(df_normalized, columns=df.columns)

# 将结果输出到excel文件
df_normalized.to_excel('output.xlsx', index=False)

三、程序代码详解

  1. 我们使用read_excel()方法用于读取excel文件,返回一个DataFrame对象。然后,我们使用MinMaxScaler()函数对数据进行归一化处理,获得一个ndarray对象。接着,我们将这个ndarray对象转换成DataFrame对象,并使用to_excel()方法输出到excel文件中。由于to_excel()方法会将DataFrame对象的索引写入excel文件中,我们使用index=False参数禁止输出索引信息。执行上述代码后,程序将读取输入文件"input.xlsx"中的数据进行归一化处理,并将结果输出到文件"output.xlsx"中。
  2. df.columns是一个pandas中的属性,用于获取DataFrame对象的列标签列表。在示例代码中,我们将归一化后的数据(一个ndarray对象)转成一个DataFrame对象,并将它的列标签设置成原始数据的列标签。这样可以保证输出的结果与原始数据具有相同的列标签。

因此,columns=df.columns的作用就是将DataFrame对象的列标签设置为原始数据的列标签。如果去掉这一行代码,输出的DataFrame对象将没有列标签。


  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值