半监督—标签传播算法

zzzzzzzz56

于 2019-04-14 11:54:14 发布

阅读量1.5k

点赞数

分类专栏：数据挖掘与机器学习

本文链接：https://blog.csdn.net/weixin_43677780/article/details/89287611

版权

本文介绍了半监督学习中的标签传播算法，该算法基于物以类聚的原理，将无标注样本与有标注样本进行相似度比较，将相似的样本赋予相同标签。首先，未标注样本的标注值设为-1，然后优先标注与有标注样本相近的无标注样本，并逐步进行标签传播。以经典的Iris数据集为例进行了说明。

摘要由CSDN通过智能技术生成

半监督学习：样本集部分有标注，部分无标注（常远大于有标注样本）

标签传播算法（LabelPropagation）：物以类聚的思想，把没有标注的样本和有标注的样本进行比较，相似度高的标为同标注，会优先标注离有标注近的无标注样本，然后再进行传播。要求未标注样本的标注值是-1。

以Iris数据集（山鸢花）为例

import numpy as np
from sklearn import datasets
#引入datasets中提供的iris数据集,分data和target两部分
iris=datasets.load_iris()
print(iris)
labels=np.copy(iris.target) #获取标注，修改标注时，保证原始数据不发生变化
print(len(labels))
random_unlabeled_points=np.random.rand(len(iris.target))#随机生成len(iris.target)个0~1的数
random_unlabeled_points=random_unlabeled_points<0.3#小于0.3的返回1，大于等于0.3返回0
#重置标签
Y=labels[random_unlabeled_points]
labels[random_unlabeled_points]=-1#把labels中对应于random_unlabeled_points是1的数换为-1
print("Unlabeled Number:",list(labels).count(-1))
print(labels)
from sklearn.semi_supervised import LabelPropagation#从半监督学习中引入标签传播算法
label_prop_model=Labe

最低0.47元/天解锁文章

zzzzzzzz56

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
半监督—标签传播算法

半监督学习：样本集部分有标注，部分无标注（常远大于有标注样本）标签传播算法（LabelPropagation）：物以类聚的思想，把没有标注的样本和有标注的样本进行比较，相似度高的标为同标注，会优先标注离有标注近的无标注样本，然后再进行传播。要求未标注样本的标注值是-1。以Iris数据集（山鸢花）为例import numpy as npfrom sklearn import data...
复制链接

扫一扫

专栏目录