多示例学习中稀疏化是有很多的论文都是在围绕如何选择representation imformation提出很多方法,前面也有提及,但是,本文是针对稀疏数据提出了利用包和示例的结构信息的方法。具体算法如下:
![](https://i-blog.csdnimg.cn/blog_migrate/b57be5491bbe2b002092728ff76ef026.png)
本文创新点就是NNrelationships,从而提出了一个representation向量zi。
后文将这个算法应用到文本分类中,并提出权重调整策略。
算法如下:
![](https://i-blog.csdnimg.cn/blog_migrate/784a384d5898187bd3bcface0874c15b.png)
公式(2)
![](https://i-blog.csdnimg.cn/blog_migrate/ee1e5ca8597e063b3f9438d076837a95.png)
公式(3)
![](https://i-blog.csdnimg.cn/blog_migrate/d8b052082745ffc9f23c50d70f73fce2.png)
总结:我看过一些文章是将示例聚类去解决示例分配上不均匀的问题,这篇文章与此相似,但是,作者提出的这个索引信息去构造特征,而且这个权重调整是作者的亮点。