论标签对无监督算法的使用

无监督机器学习常被认为与“无标签”关联,但标签在无监督学习中有特定用途,如评价模型、调优。标签可用于评估无监督学习算法的性能,如检测率、召回率和准确率,并在验证集上优化模型。无监督学习应用广泛,如互联网刷单检测和金融行业的团伙欺诈识别,业务人员的介入和标签可帮助识别模型聚类的好坏。
摘要由CSDN通过智能技术生成

说到无监督机器学习(unsupervised machinelearning),头脑中第一个蹦出来的词一定是三个字——“无标签!那么,是不是说,无监督就一定不需要标签?用了标签就一定是有监督呢?事实并非如此,这要看如何使用标签了。

#定义#

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。

无监督和有监督的区别显而易见,那就是标签。

#一句话概括#

区分有监督和无监督,就是看是否有监督(supervised),就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习,没标签则为无监督学习。

因此,如果标签被作为模型的输入,则认为是有监督;若标签只作为验证所用(为了得出TPRFPRFNR等指标),而没有作为输入,则属于无监督。

#从定义的角度阐述无监督学习的含义#

我们首先看什么是学习(learning)?一个成语就可概括:举一反三。此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,懂解题方法,因此考场上面对陌生问题也可以算出答案。机器学习的思路也类似:我们能不能利用一些训练数据(已经做过的题),使机器能够利用它们(解题方法)分析未知数据(高考的题目)?

最简单也最普遍的一类机器学习算法就是分类(classification)。对于分类,输入的训练数据有特征(feature

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值