UCI标签传播算法

最新推荐文章于 2024-05-20 19:08:38 发布

weixin_30698527

最新推荐文章于 2024-05-20 19:08:38 发布

阅读量68

点赞数

文章标签：人工智能数据库测试

原文链接：http://www.cnblogs.com/given/p/7040606.html

版权

半监督学习

　　顾名思义是介于分类（监督学习）与聚类（无监督学习）之间的一种学习范式。给定很少一部分样本的类标签，怎么样利用少部分具有类标签的数据来提高聚类的准确率是其研究主题。其中基于图的标签传播（Label Propagation）算法是有影响的算法之一。

UCI机器学习数据库：http://archive.ics.uci.edu/ml/

原理：某个测试用例的对象的标签（类别）和它附近的对象的标签相同，我们可以根据距离或者相似性来为两个对象设定一个权重。如果a和b的距离越小或者相似性越大的，则a的标签就越可能与b相同。

标签传播算法流程：

1. 构造相似性矩阵W

构造图 G=( V, E)：节点集 V表示数据点集合| V|= n，边集 E顶点对的集合，边上的权重 w表示二者的相似性，可以如下设置：

这里，α是一个参数，可适当设定1~10，也可通过实验设置一个合适的值。若不使用完全图，则可以构造 k- NN图（即一个点只与其 k个最近的邻居有边），但这可能导致得到的图不是连通的，要进行处理使之连通。

2. 构造转移概率矩阵图，可以如下设置:

3.构造数据矩阵

假设有 C个类和 L个labeled样本，我们定义一个Lx C的label矩阵Y _L，第 i行表示第 i个样本的标签指示向量，即如果第 i个样本的类别是 j，那么该行的第 j个元素为1，其它为0。
对于给定的U个unlabeled样本，构造一个U x C的label矩阵Y _U（值随便设置）。
Y _L和Y _U合并，得到一个 nx C (L+U= n)的矩阵F=[Y _L;Y _U]。

4. 传播算法

(1) 执行传播：F⁽ⁱ⁺¹⁾ = PF⁽ⁱ⁾;
(2) 重置F中labeled样本的标签：F_L= Y_L;
(3) 重复步骤(1)和(2)直到F收敛;
(4) 对于U的每条数据，设置它的类为F中对应行中最大概率值对应的类;

转载于:https://www.cnblogs.com/given/p/7040606.html

weixin_30698527

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
UCI标签传播算法

半监督学习　　顾名思义是介于分类（监督学习）与聚类（无监督学习）之间的一种学习范式。给定很少一部分样本的类标签，怎么样利用少部分具有类标签的数据来提高聚类的准确率是其研究主题。其中基于图的标签传播（Label Propagation）算法是有影响的算法之一。UCI机器学习数据库：http://archive.ics.uci.edu/ml/原理：某个测...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。