【1】机器学习--概念篇

  • 监督学习(Supervised Learning)
    监督学习是使用已知正确答案的示例来训练网络的。
    步骤1:数据集的创建和分类
    步骤2:训练
    步骤3:验证
    步骤4:使用
  • 无监督学习(Unsupervised Learning)
    无监督学习适用于具有数据集但无标签的情况。无监督学习采用输入集,并尝试查找数据中的模式。比如,将其组织成群(聚类)或查找异常值(异常检测)
    无监督的学习技术:
    — 自编码(Autoencoding)
    —主成分分析(Principal components analysis)
    — 随机森林(Random> forests)
    — K均值聚类(K-means clustering)

    无监督学习中最有前景的最新发展之一是Ian Goodfellow

  • 半监督学习(Semi-supervised Learning)
    半监督学习在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比,使用训练集的训练模型在训练时可以更为准确,而且训练成本更低

  • 强化学习(Reinforcement Learning)
    强化学习是针对再次没有标注数据集的情况而言的,但还是有办法来区分是否越来越接近目标(回报函数(reward function))。经典的儿童游戏——“hotter or colder”。(Huckle Buckle Beanstalk的一个变体)是这个概念的一个很好的例证。任务是找到一个隐藏的目标物件,然后你的朋友会喊出你是否越来越hotter(更接近)或colder(远离)目标物件。“hotter/colder”就是回报函数,而算法的目标就是最大化回报函数。可以把回报函数当做是一种延迟和稀疏的标签数据形式:而不是在每个数据点中获得特定的“right/wrong”答案,会得到一个延迟的反应,而它只会提示你是否在朝着目标方向前进。另外的例子就是训练狗狗的例子。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值