机器学习的整体框架
1.有监督的机器学习整体架构,总共分为是哪个步骤
Step1 挑选一系列的方程,称之为
模型
Step2 将方程带入训练集进行
好坏的判定
Step3 挑选
最好的方程来对测试数据进行测试
学习曲线图
我理解的对于机器学习的定义:
机器学习就是用
Linear Model \ Deep Learning \ SVM \ decision tree \ K-NN ..... 等
方法对
回归问题、分类问题、结构性问题等进行
监督学习、半监督学习、迁移学习、无监督学习和强化学习等来解决问题的过程。
1. Regression 回归
目标函数的输出 是
标量(scalar) 或者叫数据
2. Classification 分类
二元分类
多元分类
二元分类举例:邮箱判断是否为垃圾邮件
多元分类举例:大量新闻分类
分类问题分为线性问题和非线性问题
可以使用深度学习让电脑学会下围棋
监督学习特点:
需要找到输入和输出数据间有什么样的关系。
- 方程的输出称之为label方程的output一般没有好的办法取得,必须凭借人工力量标注出label
往往需要给目标函数大量的输入数据,
需要大量的付出才能得到label数据
a.如何减少label需要的量的方法1: 使用 Semi- supervised Learning 半监督学习
例如:做一个分类器,要分别照片是猫还是狗? 目前只有少量的猫和狗的labeled 数据,但是又有大量的unlabeled 猫和狗的图片数据。
稍后讲解
b.如何减少label需要的量的方法2:Transfer Learning 迁移学习
例如:做一个分类器,要分别照片是猫还是狗? 目前也只有少量的猫和狗的labeled数据,但是有大量的labeled以及unlabeled的数据,但并不知道跟我们目前的任务是否有关系,很有可能这些数据都是不相干的图片。那么不相干的图片会给我们的分类器带来什么样的帮助呢??
之后讲解
c.如何减少label需要的量的方法3:unsupervised Learning 无监督学习
无师自通。 机器自己看完数据后,自己输出。
d.machine learning还有一类问题叫structured learning 结构学习, 输出一个
有结构性的东西。
例子:
a.语音识别
b.机器翻译
c.人脸识别
structured learning 还属于一个广袤的未知世界。 regression 和classification还只是冰山一角。
e.Reinforcement Learning 强化学习
从评价和反馈中学习
reinforcement learning实在没有大量输入数据给我们进行训练学习的情况下,才进行的,
就像alpha go,先收集所有围棋高手的棋谱,进行supervised learning,直到棋谱训练完成后。
再自己跟自己下棋,进行reinforcement learning 不断优化。