Day 42：归一化，标准化,处理缺失值

最新推荐文章于 2023-12-26 10:22:12 发布

Garciaxx

最新推荐文章于 2023-12-26 10:22:12 发布

阅读量602

点赞数 1

分类专栏：学习记录学习成长学习笔记文章标签： python 大数据机器学习数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50192514/article/details/113056749

版权

Python 回忆录2021/1/24特征预处理归一化特点2021/1/24特征预处理其实就是把得到的数据样本，特征数据转换算法可用的数据。对于数值型数据，用到两大方法来预处理： 1.归一化，2.标准化。还有缺失值的预处理对于类别型数据，用one-hot编码来预处理对于时间类型数据，用时间切分方法来预处理归一化sklearn的预处理APIsklearn.preprocessing所有预处理方法都在这个模块里面特点通过对原始数据变化，映射到默认的[0，1]这个区间数据变化后最

摘要由CSDN通过智能技术生成

Python 回忆录

2021/1/24
- 特征预处理

2021/1/24

特征预处理

在这里插入图片描述
其实就是把得到的数据样本，特征数据转换算法可用的数据。

对于数值型数据，用到两大方法来预处理： 1.归一化，2.标准化。还有缺失值的预处理
对于类别型数据，用one-hot编码来预处理
对于时间类型数据，用时间切分方法来预处理

归一化

sklearn的预处理APIsklearn.preprocessing所有预处理方法都在这个模块里面

特点

通过对原始数据变化，映射到默认的[0，1]这个区间
在这里插入图片描述
数据变化后最终的数字是X"

目的是为了某一个特征不会对最终结果造成更大影响

MinMaxScaler

MinMaxScaler(feature_range = (0,1)...): 每个特征会缩放到指定范围（默认[0，1]）

-MinMaxScaler.fit_transform(x): X:numpy array格式的数据[n_samples,n_features]. 返回一个转换后相同形状的array

归一化总结

在特定场景下最大值和最小值很容易受到异常点的影响，所以这种归一化的鲁棒性（反应产品稳定的词）较差，只适合传统精确小数据场景（平常应用中很少有这样的场景，所以也很少用归一化）。

标准化

特点

通过对原始数据进行变换把数据变换到均值为0，标准差为1的范围内。
在这里插入图片描述

目的也是为了某一个特征数据不会对最终结果造成更大的影响。

StandarScaler

标准化的APIsclkit-learn.preprocessing.St

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Day 42：归一化，标准化,处理缺失值

Python 回忆录2021/1/24特征预处理归一化特点2021/1/24特征预处理其实就是把得到的数据样本，特征数据转换算法可用的数据。对于数值型数据，用到两大方法来预处理： 1.归一化，2.标准化。还有缺失值的预处理对于类别型数据，用one-hot编码来预处理对于时间类型数据，用时间切分方法来预处理归一化sklearn的预处理APIsklearn.preprocessing所有预处理方法都在这个模块里面特点通过对原始数据变化，映射到默认的[0，1]这个区间数据变化后最
复制链接

扫一扫

专栏目录

Garciaxx CSDN认证博客专家 CSDN认证企业博客

码龄4年

59: 原创

43万+: 周排名

169万+: 总排名

1万+: 访问

: 等级

620: 积分

6: 粉丝

8: 获赞

31: 评论

19: 收藏

私信

关注

热门文章

分类专栏

学习记录 58篇
学习成长 38篇
学习笔记 56篇
面经 1篇
面试 1篇

最新评论

Day 34 ：数据合并Join，Merge
weixin_51528442: 我虽然不敢说很懂, 但是我认为能把join和merge总结成相同行和相同列的人应该还没太懂我姑且提出一个假设, 会不会join和merge有一些参数可以设置?有没有可能join和merge都可以做到指定索引列, 进行索引相同行的拼接?
2021顺丰科技实习面经
m0_72457667: 朋友了解下丰图科技实习体验如何
Day 54:过拟合和欠拟合
大家一起学编程（python）: 别问，问就是好文
Day 54:过拟合和欠拟合
Garciaxx: 谢谢你的博客也很棒！
Day 54:过拟合和欠拟合
Garciaxx: 谢谢~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。