来自语义信息论的多标签分类方法——有简单方法干嘛要用复杂的？

lcguang老鲁

于 2018-11-11 18:01:53 发布

阅读量577

点赞数

文章标签：机器学习多标签分类语义信息方法语义信道

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lcguang1955/article/details/83960562

版权

流行的多标签分类方法大多把多分类化为多个二分类。流行的有One-to-Rest方法和Binary Relevance方法。

One-to-Rest方法的问题是，围绕一个标签y1分类，把一个没有y的例子当成y1的反例，这时不对的。比如两个例子（25岁， “年轻人”）和（24岁，“成年人”）都是对的。设y1="年轻人"，把24岁划到rest=非年轻人，就错了.

Binary Relevance能可这个问题，但是对样本要求太高，运算复杂。

新的方法很简单，学习的时候得到逻辑分类函数或隶属函数 T(qj|X) (q=theta), 令它正比于转移概率函数 P(yj|X).

分类的时候用最大语义信息准则就行了。

详见http://www.survivor99.com/lcg/CM/forDenotation.pdf

更多讨论见 http://www.survivor99.com/lcg/CM/recent.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。