python标准化地址数据_Python：数据标准化

最新推荐文章于 2023-06-21 01:06:52 发布

weixin_39710660

最新推荐文章于 2023-06-21 01:06:52 发布

阅读量709

点赞数

文章标签： python标准化地址数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39710660/article/details/111742752

版权

这篇博客介绍了Python中数据标准化的三种方法：最小-最大标准化、Z-score标准化和小数定标规范化。通过实例展示了如何使用pandas和sklearn库对数据进行标准化处理，包括数据读取、列选择、标准化计算以及结果合并。同时，文中还讨论了不同标准化方法的特点和实现细节。

摘要由CSDN通过智能技术生成

第一步：导入本地的目标数据集

使用pandas库中的read_excel()函数导入的数据格式会默认为dataframe(数据框)，可以直接使用数据框支持的所有方法。

观察数据可以发现，数据后三列为数值型，但是各个数值的度量单位是不同的，housesize一般以平方米为单位，rental一般以元为单位，houseage一般以年为单位。

第二步：截取出需要进行标准化处理的列

第三步：进行数据标准化

方法一：最小-最大标准化

公式：

min指x所在列的最小值，max指x所在列的最大值。x'指标准化后的x。

代码如下：

注释：①标准化后的数据框d还是数据框格式~

②数据框下面的rename()方法可以用于对数据框的列名进行随意更改~采用字典格式进行列名修改。

colums = {'originalname1':'newname1','originalname3':'newname3'}无需修改的列名可以直接跳过。

inplace = True表示替换原来的列名，直接显示最新的列名。

最后，需要将标准化后的数据拼接到原数据中去。

注释：①这里采用的拼接方法concat()为直接拼接&#

最低0.47元/天解锁文章

weixin_39710660

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。