PULearning
文章平均质量分 89
下一步
长期关注NLPMLCLinux等
展开
-
【每周一文】Building Text Classifiers Using Positive and Unlabeled Examples(2003)
概述 PULearning是一类机器学习算法,主要解决的问题是给定训练样本只有正样本和一批未标记的样本,学习一个分类器进行分类。这是一类比较难解决的问题,由于没有负样本其评估的方法不好确定;但是有很多的应用场景,例如蛋白质序列查找、噪声发现等。 常用的解决思路主要分为两步: 1. 识别出一批可靠的负样本集合。 2. 根据正负样本训练多个分类器从中选择一个最优的作为最终的分类器。 该文介绍原创 2016-04-12 22:55:55 · 2061 阅读 · 0 评论 -
【每周一文】Learning Classifiers from Only Positive and Unlabeled Data(2008)
概述 本文也是用于求解PULearning问题,并且提出在样本满足一定分布情况下,根据正样本和未标记样本作为负样本训练出来的分类模型,预测出来的结果和该样本属于正样本的概率存在一个固定常数系数。 根据该假设提出两种模型训练思路,能够得到最好的效果。 问题求解 对于给定的样本数据引入第三个随机变量S表示该样本是否被标记过,则p(x,y,s)满足一定的概率分布。 变量含义x为样本特征数据原创 2016-04-12 22:56:35 · 3820 阅读 · 3 评论