- 监督学习(Supervised Learning)
监督学习是使用已知正确答案的示例来训练网络的。
步骤1:数据集的创建和分类
步骤2:训练
步骤3:验证
步骤4:使用 无监督学习(Unsupervised Learning)
无监督学习适用于具有数据集但无标签的情况。无监督学习采用输入集,并尝试查找数据中的模式。比如,将其组织成群(聚类)或查找异常值(异常检测)
无监督的学习技术:
— 自编码(Autoencoding)
—主成分分析(Principal components analysis)
— 随机森林(Random> forests)
— K均值聚类(K-means clustering)无监督学习中最有前景的最新发展之一是Ian Goodfellow
半监督学习(Semi-supervised Learning)
半监督学习在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比,使用训练集的训练模型在训练时可以更为准确,而且训练成本更低- 强化学习(Reinforcement Learning)
强化学习是针对再次没有标注数据集的情况而言的,但还是有办法来区分是否越来越接近目标(回报函数(reward function))。经典的儿童游戏——“hotter or colder”。(Huckle Buckle Beanstalk的一个变体)是这个概念的一个很好的例证。任务是找到一个隐藏的目标物件,然后你的朋友会喊出你是否越来越hotter(更接近)或colder(远离)目标物件。“hotter/colder”就是回报函数,而算法的目标就是最大化回报函数。可以把回报函数当做是一种延迟和稀疏的标签数据形式:而不是在每个数据点中获得特定的“right/wrong”答案,会得到一个延迟的反应,而它只会提示你是否在朝着目标方向前进。另外的例子就是训练狗狗的例子。
【1】机器学习--概念篇
最新推荐文章于 2024-08-07 21:18:06 发布