多实例学习(Multi Instance Learning)
定义:
假设训练数据集中每个数据是一个包(Bag),每个包都是实例(Instance)的集合,每个包都有一个训练标记,而包中的实例没有标记。多实例的目的是对新的包进行类别预测。
规则:
- 若包中至少存在一个正标记的实例,则包被赋予正标记。
- 若包被标为负标记,那其中所有的实例均为负标记。(如果一个包里面所有的实力都被分类器判定标签为-,则该包为-包)
(训练的时候没有给示例标记,只给了包的标记,但示例的标记确实存在,存在正负示例来判断正负类别)。
机器学习目前有监督学习,费监督学习以及强化学习,那么,,,他可能属于若监督学习?(不太懂划分的界限)
区别:
- 与监督学习相,多实例学习的数据集中的样本实例的标记未知,但监督学习的训练样本集中每个实例都有一个已知的标记。
- 与非监督学习相比,多实例学习只有包有标记,而费监督学习样本所有实例均没有标记
实际应用:
在图像分类中,一张图片就是一个包,图片分割出的patches就是示例。