基于贝叶斯后验优化的连续值离散化

本文介绍了如何使用基于贝叶斯后验优化的方法对连续值数据进行离散化,特别是在数据挖掘和机器学习场景中。通过设定一系列假设和模型,目标是找到最大化后验概率的分段策略。文章提供了模型的详细推导,并给出了C语言实现的代码链接,以解决实际数据分段问题。
摘要由CSDN通过智能技术生成

将连续值离散化的问题,在数据挖掘和机器学习的任务中并不鲜见,当然离散化的方法也有很多。

本文将要介绍的是一种基于数据标签(label)来对连续数据值做离散化分割的监督学习方法。

 

问题:

考虑有如下数据:

   1,0

   2,0

   3,0

   4,0

   5,0

   6,1

   7,1

   8,1

   9,1

   10,1

第一列是连续值数据,而第二列是数据的类别标签(label)

我们希望对数据进行划分,使得划分的结果符合数据的类标签的分布。

即,预期前5个值为一段,后5个值为另一段。

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值