机器学习03：数据预处理

最新推荐文章于 2024-07-17 01:42:37 发布

Sayram_0

最新推荐文章于 2024-07-17 01:42:37 发布

阅读量420

点赞数

分类专栏：机器学习文章标签：机器学习 python 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45476502/article/details/108672406

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

机器学习：数据预处理

数据预处理包括3个方面：特征尺度归一化、降维、特征选择。下面我们将一一介绍。

1 特征尺度归一化

在多个特征面前，我们要确保特征在相同的尺度内，也就是说，每个特征值的数量级不能相差过大，或者说，要尽量保证每个特征值的数量级一致。对于未归一化的数据集，如果我们做梯度下降，可能会出现收敛过慢的情况。
下面两幅图分别是归一化前和归一化后损失函数的状态（ $x_1$ 和 $x_2$ 分别是两个特征， $0<x_1<2000，1<x_2<5$ ）：
在这里插入图片描述

1.1 范围归一化

对于某个特征向量 $x$ ，进行范围归一化后：
$\pmb{x'}=\frac{\pmb{x}-min(\pmb{x})}{max(\pmb{x})-min(\pmb{x})}$

1.2 中心化

对于某个特征向量 $x$ ，进行中心化后：
$x′x′x′ \pmb{x'}=\pmb{x}-\overline{\pmb{x}}$

1.3 标准化

对于某个特征向量 $x$ ，进行标准化后：
$\pmb{x'}=\frac{\pmb{x}-\pmb{\overline{x}}}{\pmb{\sigma}}$

2 降维

主成分分析（Principal Component Analysis）：
在这里插入图片描述

3 特征选择（feature selection）

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。