百面机器学习总结笔记（第一章特征工程）

最新推荐文章于 2024-01-22 18:44:45 发布

Avery123123

最新推荐文章于 2024-01-22 18:44:45 发布

阅读量409

点赞数 1

分类专栏：算法岗面试笔试准备文章标签：百面机器学习总结特征工程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Avery123123/article/details/102672549

版权

百面机器学习总结笔记（第一章特征工程）

百面机器学习总结笔记
- 第一章特征工程

百面机器学习总结笔记

第一章特征工程

第1节特征归一化

场景描述
为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理( Normalization) ，使得不同指标之间具有可比性。

知识点

问题：为什么需要对数值类型的特征做归一化?

分析与解答
对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。最常用的方法主要再以下两种：
( 1 )线性函数归化( Min-Max Scaling ) 。它对原始数据进行线性变换，使结果映射到 [0,1] 的范围，实现对原始数据的等比缩放。归一化公式如下：

( 2 )零均值归一化( Z-Score Normalization ) 。它会将原始数j居映射到均值为 0 ，标准差为 1 的分布上。那么归一化公式定义为：
实例说明

为何归一化
注意：当然，数据归一化并不是万能的。在实际应用中，通过梯度下降法求解的模型通常是需要归一化的。包括：线性回归、逻辑回归、支持向量机、神经网络等模型。但对于决策树模型则并不适用，以 C4.5 为例，决策树在进行节点分裂时主要依据数据集 D 关于特征 x的信息增益比，而信息增益比跟特征是否经过归一化是无关的，因为归一化并不会改变样本在特征 x 上的信息增益。

第2节类别型特征

场景描述
类别型特征(Categorical Feature)主要是指性别(男、女

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。