笔记Day3

本文探讨了数值型数据中的归一化和标准化方法,强调了缺乏归一化的潜在问题,如部分特征权重过大。标准化通过消除尺度效应和异常值影响,提高模型稳定性。同时介绍了one-hot编码和缺失值处理策略,如使用平均值或中位数填补。关键概念包括平方差、Outliers、鲁棒性以及不同数据处理技术的应用场景。
摘要由CSDN通过智能技术生成

数值型 归一化 标准化 类别 one-hot编码

缺乏归一化导致部分数据占较大权重,但实际上所有特征都是同等重要

求平方差是会导致尺度较大的数据的影响力进一步提升

Outliers会导致模型向异常方向偏移  

标准化 减去平均数 除以标准差 数据的稳定性

有助于取消异常点

标准化对异常值鲁棒性高 适合现在嘈杂环境

插补缺失值 通过平均值 中位数可以按行和列来填补 一般以列也就是特征来填补

奇怪,我怎么记得1才是列S

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值