【注】最近开始听台湾大学李宏毅的机器学习,是学长推荐的,并开始做相应的笔记和内容整理。
详细可以访问课程主页
Machine Learning ≈ Looking for a Function
Framework(框架)
机器学习的步骤很简单,就像把大象装进冰箱里一样简单。主要分为3步:
(1)定义一组函数;
(2)评价函数的好坏;
(3)选择最好的函数。
Learning Map
浅蓝色的表示学习方案(scenario),通常使不能选择的。
主要分为:
1)监督学习;
2)半监督学习;
3)迁移学习;
4)无监督学习;
5)增强学习。
任务分为:
回归、分类和结构化学习。
回归和分类经常听到,结构化学习是未知的暗黑大陆。
方法分为:
1)线性模型;
2)非线性模型。其中非线性模型包含深度学习和传统机器学习的算法。
Classification即分类
分类包含两类
Binary Classification(二分类)和Multi-class Classification(多类分类)
二分类只输出yes或no,而多分类则是从多个分类中选择一个答案
二分类的典型例子是垃圾邮件的分类
多分类的例子是文档的分类(.doc/.ppt/.xls)
Training Data:Input/output pair of target
分类的训练数据是一组输入输出的目标值
Function:Function output = label
函数的输出是标签
Semi-supervised Learning即半监督学习
半监督学习使用大量的未标记数据,以及同时使用标记数据。
Transfer Learning即迁移学习
迁移学习是一堆没有标签的或者有标签的数据对于训练产生怎么样的影响
Unsupervised Learning即无监督学习
无监督学习的训练数据集是没有标签的,只有input没有output,让机器自己学习里面的联系
Structured Learning即结构学习
Beyond Classification
它是一组输出有结构性的东西,比如机器翻译
Reinforcement Learning即增强学习
增强学习的典型特点就是从评价中学习,并不告诉机器怎么做,而是告诉机器这样做对不对
Alpha Go is supervised learning + reinforcement learning.