python实现三种数据预处理

最新推荐文章于 2024-07-09 14:17:32 发布

太阳旁边的星星

最新推荐文章于 2024-07-09 14:17:32 发布

阅读量3k

点赞数 5

分类专栏：大论文文章标签： python 数据预处理

本文链接：https://blog.csdn.net/weixin_38339143/article/details/80005493

版权

本文介绍了使用Python进行数据预处理的三种方法：区间缩放，标准化和对数转换。详细步骤包括读取数据，进行相应处理，以及如何将处理后的数据以DataFrame格式存储为CSV文件。

摘要由CSDN通过智能技术生成

主要对数据进行了三种预处理：

1．区间缩放

读取数据、数据处理、存储数据

import pandas as pd

import numpy as np

from sklearn import preprocessing

import matplotlib.pyplot as plt

 

plt.rcParams['font.sans-serif'] =['SimHei'] #用来正常显示中文标签 

plt.rcParams['axes.unicode_minus'] =False #用来正常显示负号

 

Filename = 'Hits perSecond_T20m_130.csv'

data_f = pd.read_csv(Filename)#二维dataframe格式

#print(data_f)

plt.plot(data_f[200:600])

plt.title('数据预处理前')

plt.show()

 

print('***2.数据归一化,映射到区间[min,max]：')

min_max_scaler =preprocessing.MinMaxScaler(feature_range=(0,10))

data_mi_ma =min_max_scaler.fit_transform(data_f)

plt.plot(data_mi_ma[200:600])

plt.title('数据预处理后')

plt.show()

 

print(type(data_mi_ma))

data_ = pd.DataFrame(data_mi_ma)

print(type(data_))

data_.to_csv("afterpre.csv",index=0,header=0)#index=0,不保留索引列，header=0不