zscore标准化步骤_归一化z-score标准化

本文介绍了z-score标准化方法,通过调整数据使得均值为0,标准差为1。同时展示了如何使用Python的sklearn库进行数据归一化处理,通过对`listings.csv`数据集的操作,演示了数据预处理的步骤,最后输出了处理后的数据前几行。
摘要由CSDN通过智能技术生成

z-score标准化

z-score标准化是将数据按比例缩放,使之落入一个特定区间。 要求:均值 μ = 0 ,σ = 1

标准差公式:

26d198115908

image

z-score标准化转换公式:

26d198115908

image

归一化

归一化:把数变为(0,1)之间的小数

归一化公式:

26d198115908

image

这里利用sklearn的MinMaxScaler和StandardScaler两个类,对所有数据进行归一化处理

import pandas as pd

from sklearn import preprocessing

from sklearn.preprocessing import MinMaxScaler

from sklearn.preprocessing import StandardScaler

# 读取数据

features = ['accommodates','bedrooms','bathrooms','beds','price','minimum_nights','maximum_nights','number_of_reviews']

dc_listings = pd.read_csv(r'D:\codes_jupyter\数据分析_learning\课件\05_K近邻\listings.csv', engine='python')

dc_listings = dc_listings[features]

# 对price列进行一定的处理,使其变成float型

dc_listings['price'] = dc_listings.price.str.replace(r'\$|,', '').astype(float)

# 对缺失值进行处理,删除有缺失值的数据

dc_listings = dc_listings.dropna()

# 归一化

dc_listings[features] = MinMaxScaler().fit_transform(dc_listings)

# 标准化

# dc_listings[features] = StandardScaler().fit_transform(dc_listings)

print(dc_listings.shape)

dc_listings.head()

输出结果如下:

26d198115908

image

得到标准化的数据后,就可以利用多个指标对房租价格进行预测了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值