半监督—标签传播算法

本文介绍了半监督学习中的标签传播算法,该算法基于物以类聚的原理,将无标注样本与有标注样本进行相似度比较,将相似的样本赋予相同标签。首先,未标注样本的标注值设为-1,然后优先标注与有标注样本相近的无标注样本,并逐步进行标签传播。以经典的Iris数据集为例进行了说明。
摘要由CSDN通过智能技术生成

半监督学习:样本集部分有标注,部分无标注(常远大于有标注样本)

标签传播算法(LabelPropagation):物以类聚的思想,把没有标注的样本和有标注的样本进行比较,相似度高的标为同标注,会优先标注离有标注近的无标注样本,然后再进行传播。要求未标注样本的标注值是-1。

以Iris数据集(山鸢花)为例

import numpy as np
from sklearn import datasets
#引入datasets中提供的iris数据集,分data和target两部分
iris=datasets.load_iris()
print(iris)
labels=np.copy(iris.target) #获取标注,修改标注时,保证原始数据不发生变化
print(len(labels))
random_unlabeled_points=np.random.rand(len(iris.target))#随机生成len(iris.target)个0~1的数
random_unlabeled_points=random_unlabeled_points<0.3#小于0.3的返回1,大于等于0.3返回0
#重置标签
Y=labels[random_unlabeled_points]
labels[random_unlabeled_points]=-1#把labels中对应于random_unlabeled_points是1的数换为-1
print("Unlabeled Number:",list(labels).count(-1))
print(labels)
from sklearn.semi_supervised import LabelPropagation#从半监督学习中引入标签传播算法
label_prop_model=Labe
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值