常用的两种数据平滑算法

常用的两种数据平滑算法

说明:拉普拉斯平滑算法参看的是中科院王斌老师的现代信息检索ppt

          古德-图灵(Good-Turing)平滑 算法转自:http://hi.baidu.com/kangwp/item/8533124292d026e6bdf45150

平滑算法,就是劫富济贫!!

一、拉普拉斯平滑

        又称为加1平滑,现在针对文本处理为例进行说明:

       ,也就是选取的特征数。

二、古德-图灵(Good-Turing)平滑

        古德-图灵(Good-Turing)估计法是很多平滑技术的核心,于1953年有古德(I.J.Good)引用图灵(Turing)的方法而提出来的。其基本思想是:利用频率的类别信息来平滑频率。对于任何发生r次数的n元语法,都假设它发生了r*次。


贝塞尔数据平滑算法是一种常用数据平滑处理的算法,它可以通过通过一系列控制点来定义曲线,并且能够对给定的输入数据进行平滑处理。在Java中,我们可以编写一个贝塞尔数据平滑算法的工具类来实现这一功能。 首先,我们需要定义一个Point类,用于表示二维空间中的一个点。这个类可以包含两个属性x和y,分别表示点的横坐标和纵坐标。同时,我们还可以为这个类实现一些常用的方法,例如获取点的横坐标和纵坐标的方法。 接下来,我们可以在工具类中定义一个方法,用于根据给定的控制点列表和平滑度参数来计算出平滑后的曲线上的点。这个方法可以接受一个Point类型的列表作为输入,以及一个平滑度参数smoothness,表示控制点之间的平滑程度。 在这个方法中,我们可以首先计算出每个控制点之间的插值点,通过贝塞尔曲线的计算公式来确定。具体的计算过程可以在for循环中实现,每次计算出一个插值点,然后将其添加到结果列表中。在计算过程中,我们可以根据平滑度参数来调整曲线的平滑程度,例如可以通过调整控制点之间的距离来实现。 最后,我们可以在工具类中定义一个主方法,用于测试这个贝塞尔数据平滑算法。在这个方法中,我们可以创建一个测试用的控制点列表,调用平滑算法的方法来获取平滑后的曲线上的点,并输出结果。 总之,通过编写一个贝塞尔数据平滑算法的工具类,我们可以方便地在Java中进行数据平滑处理。这个工具类可以根据控制点列表和平滑度参数来计算出平滑后的曲线上的点,并可以方便地进行测试和使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值