来自语义信息论的多标签分类方法——有简单方法干嘛要用复杂的?

流行的多标签分类方法大多把多分类化为多个二分类。流行的有One-to-Rest方法和Binary Relevance方法。

One-to-Rest方法的问题是, 围绕一个标签y1分类, 把一个没有y的例子当成y1的反例, 这时不对的。 比如两个例子(25岁, “年轻人”)和(24岁,“成年人”)都是对的。 设y1="年轻人", 把24岁划到rest=非年轻人,就错了.

Binary Relevance能可这个问题, 但是对样本要求太高,运算复杂。

新的方法很简单, 学习的时候 得到逻辑分类函数或隶属函数 T(qj|X) (q=theta), 令它正比于转移概率函数 P(yj|X).

分类的时候用最大语义信息准则就行了。

详见http://www.survivor99.com/lcg/CM/forDenotation.pdf

更多讨论见 http://www.survivor99.com/lcg/CM/recent.html 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值