论文阅读---Solving multi-instance problems with classifier ensemble based on constructive clustering

多示例学习:传统的机器学习将单个示例作为一个目标对象,为其分配标签,而多实例学习将多个示例作为一个,并将一个包作为一个目标对象,为其分配标签。

原文使用将包映射为向量的方式来实现多示例问题的预测

本文的符号系统:

符号含义
B \mathcal{B} B所有包的集合
X i X^i Xi i i i个包
x x x示例
D \mathcal{D} D有m个数字的集合 { d 1 , d 2 , … , d m } \{d_1,d_2,\dots,d_m\} {d1,d2,,dm}
Z Z Z存放所有示例的集合
< y 1 j , … , y d i j , y l a b e l j > <y_1^j,\dots,y_{d_i}^j,ylabel^j> <y1j,,ydij,ylabelj> X j X^j Xj映射后的向量表示
y l a b e l j ylabel^j ylabelj X j X^j Xj的标签

原文伪代码如下所示:
在这里插入图片描述
简单描述一下这个伪代码:

  • 先将所有包中的所有示例都放在集合 Z Z Z中,再对 Z Z Z中元素进行聚类。

但是要聚类成多少个簇呢?前面符号系统中提到有一个 D \mathcal{D} D,里面存储了许多的数字,我们就第一次聚类为 d 1 d_1 d1个簇,第二次聚类成 d 2 d_2 d2个簇,这样使用不同的 d d d,就可以生成不同的分类器,这些不同的分类器,可以被组合成一个集合进行预测。
这也是我读到这篇文章中,觉得比较新颖的地方,简单的改一下参数,就出现了多种不同的分类器,然后由这些分类器共同决定分类结果。

  • 这个算法将一个包映射为一个由二元的特征表示的,长度为 d d d的向量。前面咱们不是进行了分簇的操作嘛,若第 i i i个簇中有来自 X j X^j Xj中的示例,则 y i j y_i^{j} yij等于1。相反的,若第 i i i个簇中没有来自 X j X^j Xj中的示例,则 y i j y_i^{j} yij等于0

二元特征:就是0和1
这样,通过非常简单的操作,我们就得到了包的映射向量

  • 接下来就是使用使用映射向量训练分类器,根据不同的 d d d值,可以训练出不同的分类器。用不同的分类器对需要预测的包进行预测,看哪种预测结果出现的更多,就认为这是我们最终的预测结果。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值