监督学习与无监督学习

1.监督学习

监督学习(Supervised learning)是通过已有的训练样本(数据集),已知输入和输出之间对应关系。去训练得到一个最优的模型,再利用这个模型将所有的输入映射为相应的输出结果。在监督学习中训练数据既有特征(feature)又有标签(label),而标签的作用就是对数据的一种标注。比如,金融行业中股票的预测分析中,今天之前的股价就是一个标签,我们可以根据之前这个股价标签去预测分析股票的价格走势。

监督学习的函数输出可以是一个连续的值,我们通常称为回归分析,或是预测一个分类标签,称作分类。

总结来说。监督学习是通过训练样本,并且根据已知的标签(label)去训练得到一个最优模型,而最优模型的确定是:通过不断地调参,使模型的测试误差最小。

2.无监督学习

无监督式学习(Unsupervised Learning )是人工智能网络的一种算法(algorithm),其目的是去对原始资料进行分类,以便了解资料内部结构。有别于监督式学习网络,无监督式学习网络在学习时并不知道其分类结果是否正确,亦即没有受到监督式增强(告诉它何种学习是正确的)。其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。

无监督学习里典型的例子就是聚类了。聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

有时,我们对待某些特定的问题过程中,并没有现成的训练样本,我们可以根据该问题的相关专家的定义来确定数据的训练样本,这样,我们就可以把无监督学习转化为监督学习。

3.半监督学习

半监督学习(Semi-Supervised Learning,SSL)是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。

半监督学习的基本设置是给定一个来自某未知分布的有标记示例集L={(x1, y1), (x2, y2), …, (x |L|,y|L|)}以及一个未标记示例集U = {x1’, x2’, … , x |U|’},期望学得函数f: X→Y可以准确地对示例x 预测其标记y。这里xi, xj’ ∈X 均为d维向量,yi∈Y为示例xi的标记,|L|和|U|分别为L和U的大小,即它们所包含的示例数。

半监督学习的基本思想是利用数据分布上的模型假设建立学习器对未标签样例进行标签。它的形式化描述是给定一个来自某未知分布的样例集S=LU,其中L是已标签样例集L={(x1,y1),(x2,y2),(x|L|,y|L|)},U是一个未标签样例集U={xc1,xc2,xc|U|},希望得到函数f:XyY可以准确地对样例x预测其标签y。其中xi,xc1均为d维向量,ytIY为样例xi的标签,|L|和|U|分别为L和U的大小,即所包含的样例数,半监督学习就是在样例集S上寻找最优的学习器。如果S=L,那么问题就转化为传统的有监督学习;反之,如果S=U,那么问题是转化为传统的无监督学习。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值