流行的多标签分类方法大多把多分类化为多个二分类。流行的有One-to-Rest方法和Binary Relevance方法。
One-to-Rest方法的问题是, 围绕一个标签y1分类, 把一个没有y的例子当成y1的反例, 这时不对的。 比如两个例子(25岁, “年轻人”)和(24岁,“成年人”)都是对的。 设y1="年轻人", 把24岁划到rest=非年轻人,就错了.
Binary Relevance能可这个问题, 但是对样本要求太高,运算复杂。
新的方法很简单, 学习的时候 得到逻辑分类函数或隶属函数 T(qj|X) (q=theta), 令它正比于转移概率函数 P(yj|X).
分类的时候用最大语义信息准则就行了。
详见http://www.survivor99.com/lcg/CM/forDenotation.pdf
更多讨论见 http://www.survivor99.com/lcg/CM/recent.html