利用python对一个excel列表.xlsx进行归一化，并且导出归一化后的excel列表

最新推荐文章于 2024-10-22 11:01:59 发布

小桥流水---人工智能

最新推荐文章于 2024-10-22 11:01:59 发布

阅读量1.9k

点赞数 3

分类专栏： Python程序代码文章标签： python excel

本文链接：https://blog.csdn.net/qlkaicx/article/details/130921458

版权

Python程序代码专栏收录该内容

253 篇文章

订阅专栏

在这里插入图片描述

文章目录

一、思路如下
二、使用的程序代码
三、程序代码详解

一、思路如下

我们使用pandas库中的read_excel()方法读入excel文件，使用MinMaxScaler()函数对数据进行归一化处理，然后利用to_excel()方法将结果输出到excel文件中。

二、使用的程序代码

import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 读取excel文件
df = pd.read_excel('input.xlsx')

# 数据归一化
scaler = MinMaxScaler()
df_normalized = scaler.fit_transform(df)

# 转换成DataFrame
df_normalized = pd.DataFrame(df_normalized, columns=df.columns)

# 将结果输出到excel文件
df_normalized.to_excel('output.xlsx', index=False)

三、程序代码详解

我们使用read_excel()方法用于读取excel文件，返回一个DataFrame对象。然后，我们使用MinMaxScaler()函数对数据进行归一化处理，获得一个ndarray对象。接着，我们将这个ndarray对象转换成DataFrame对象，并使用to_excel()方法输出到excel文件中。由于to_excel()方法会将DataFrame对象的索引写入excel文件中，我们使用index=False参数禁止输出索引信息。执行上述代码后，程序将读取输入文件"input.xlsx"中的数据进行归一化处理，并将结果输出到文件"output.xlsx"中。
df.columns是一个pandas中的属性，用于获取DataFrame对象的列标签列表。在示例代码中，我们将归一化后的数据(一个ndarray对象)转成一个DataFrame对象，并将它的列标签设置成原始数据的列标签。这样可以保证输出的结果与原始数据具有相同的列标签。

因此，columns=df.columns的作用就是将DataFrame对象的列标签设置为原始数据的列标签。如果去掉这一行代码，输出的DataFrame对象将没有列标签。