机器学习—数据平滑

问题:为什么进行平滑?

数据平滑是数据预处理中比较重要的一块,但是往往会忽略它。数据平滑通常对噪声这一块进行处理,平滑的本质就是用来解决零概率问题,尽量使概率分布趋于均匀,使数据变得更可用。

下面介绍几种自己总结的数据平滑的方法

1.分箱法平滑

首先进行数据排序,将他们分到等宽的箱中(既是分成几部分),然后按照箱中数据的平均值(中值等)进行平滑。

2.回归法平滑

通过数据找到一个回归函数进行数据的平滑,这种方法对连续型数据较好。

例:数据有中两个相关的变量,找到它们之间的关系,用一个函数表示(例:y=kx+b),即建立数学模型去预测下一个数值。

3.加法平滑方法(拉普拉斯平滑)

Ng大牛讲到过的一个差不多的例子:

例子勇士队与湖人队2050年某四场比分如下&#x

  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值