【Python机器学习】——缩放

最新推荐文章于 2024-08-26 08:54:09 发布

玄链教育

最新推荐文章于 2024-08-26 08:54:09 发布

阅读量929

点赞数

分类专栏： # python语言基础文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/mask5726/article/details/130142139

版权

python语言基础专栏收录该内容

244 篇文章 3 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

在Python机器学习中，数据缩放是解决不同数值尺度问题的关键步骤。通过标准化方法，例如使用sklearn库的StandardScaler，可以将特征如车重和排量转化为可比较的新值，便于模型训练和比较。本文展示了如何使用StandardScaler进行数据预处理，并通过实例解释了缩放数据后如何进行预测。

摘要由CSDN通过智能技术生成

Python机器学习——缩放

一、Python机器学习缩放

特征缩放（Scale Features）
当您的数据拥有不同的值，甚至使用不同的度量单位时，可能很难比较它们。与米相比，公斤是多少？或者海拔比较时间呢？
这个问题的答案是缩放。我们可以将数据缩放为易于比较的新值。
请看下表，它与我们在多元回归一章中使用的数据集相同，但是这次，Volume 列包含的单位是升，而不是 ccm（1.0 而不是 1000）。
Car Model Volume Weight CO2
Toyota Aygo 1.0 790 99
Mitsubishi Space Star 1.2 1160 95
Skoda Citigo 1.0 929 95
Fiat 500 0.9 865 90
Mini Cooper 1.5 1140 105
VW Up! 1.0 929 105
Skoda Fabia 1.4 1109 90
Mercedes A-Class 1.5 1365 92
Ford Fiesta 1.5 1112 98
Audi A1 1.6 1150 99
Hyundai I20 1.1 980 99
Suzu

了解本专栏

超级会员免费看

玄链教育

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Python机器学习】——缩放

请看下表，它与我们在多元回归一章中使用的数据集相同，但是这次，Volume 列包含的单位是升，而不是 ccm（1.0 而不是 1000）。很难将排量 1.0 与车重 790 进行比较，但是如果将它们都缩放为可比较的值，我们可以很容易地看到一个值与另一个值相比有多少。当您的数据拥有不同的值，甚至使用不同的度量单位时，可能很难比较它们。缩放数据有多种方法，在本教程中，我们将使用一种称为标准化（standardization）的方法。其中 z 是新值，x 是原始值，u 是平均值，s 是标准差。
复制链接

扫一扫