zscore标准化步骤_归一化z-score标准化

最新推荐文章于 2024-08-20 22:03:48 发布

weixin_39901213

最新推荐文章于 2024-08-20 22:03:48 发布

阅读量5.8k

点赞数

文章标签： zscore标准化步骤

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39901213/article/details/113690064

版权

本文介绍了z-score标准化方法，通过调整数据使得均值为0，标准差为1。同时展示了如何使用Python的sklearn库进行数据归一化处理，通过对`listings.csv`数据集的操作，演示了数据预处理的步骤，最后输出了处理后的数据前几行。

摘要由CSDN通过智能技术生成

z-score标准化

z-score标准化是将数据按比例缩放，使之落入一个特定区间。要求：均值 μ = 0 ，σ = 1

标准差公式：

26d198115908

image

z-score标准化转换公式：

26d198115908

image

归一化

归一化：把数变为(0，1)之间的小数

归一化公式：

26d198115908

image

这里利用sklearn的MinMaxScaler和StandardScaler两个类，对所有数据进行归一化处理

import pandas as pd

from sklearn import preprocessing

from sklearn.preprocessing import MinMaxScaler

from sklearn.preprocessing import StandardScaler

# 读取数据

features = ['accommodates','bedrooms','bathrooms','beds','price','minimum_nights','maximum_nights','number_of_reviews']

dc_listings = pd.read_csv(r'D:\codes_jupyter\数据分析_learning\课件\05_K近邻\listings.csv', engine='python')

dc_listings = dc_listings[features]

# 对price列进行一定的处理，使其变成float型

dc_listings['price'] = dc_listings.price.str.replace(r'\$|,', '').astype(float)

# 对缺失值进行处理,删除有缺失值的数据

dc_listings = dc_listings.dropna()

# 归一化

dc_listings[features] = MinMaxScaler().fit_transform(dc_listings)

# 标准化

# dc_listings[features] = StandardScaler().fit_transform(dc_listings)

print(dc_listings.shape)

dc_listings.head()

输出结果如下：

26d198115908

image

得到标准化的数据后，就可以利用多个指标对房租价格进行预测了。

weixin_39901213

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。