机器学习系列 - 入门

机器学习的整体框架
1.有监督的机器学习整体架构,总共分为是哪个步骤
    Step1 挑选一系列的方程,称之为模型
    Step2 将方程带入训练集进行好坏的判定
    Step3 挑选最好的方程来对测试数据进行测试



学习曲线图

我理解的对于机器学习的定义:
机器学习就是用Linear Model \ Deep Learning \ SVM \ decision tree \ K-NN ..... 方法回归问题、分类问题、结构性问题等进行监督学习、半监督学习、迁移学习、无监督学习和强化学习等来解决问题的过程。


1. Regression 回归
    目标函数的输出 是 标量(scalar) 或者叫数据


2. Classification 分类
    二元分类
    多元分类

二元分类举例:邮箱判断是否为垃圾邮件

多元分类举例:大量新闻分类



分类问题分为线性问题和非线性问题
    


可以使用深度学习让电脑学会下围棋

监督学习特点:
需要找到输入和输出数据间有什么样的关系。
  • 方程的输出称之为label方程的output一般没有好的办法取得,必须凭借人工力量标注出label
往往需要给目标函数大量的输入数据, 需要大量的付出才能得到label数据
a.如何减少label需要的量的方法1: 使用 Semi- supervised Learning 半监督学习
例如:做一个分类器,要分别照片是猫还是狗? 目前只有少量的猫和狗的labeled 数据,但是又有大量的unlabeled 猫和狗的图片数据。 稍后讲解
b.如何减少label需要的量的方法2:Transfer Learning 迁移学习
例如:做一个分类器,要分别照片是猫还是狗? 目前也只有少量的猫和狗的labeled数据,但是有大量的labeled以及unlabeled的数据,但并不知道跟我们目前的任务是否有关系,很有可能这些数据都是不相干的图片。那么不相干的图片会给我们的分类器带来什么样的帮助呢??之后讲解
c.如何减少label需要的量的方法3:unsupervised Learning 无监督学习
无师自通。 机器自己看完数据后,自己输出。

d.machine learning还有一类问题叫structured learning 结构学习, 输出一个有结构性的东西。
例子:
a.语音识别
b.机器翻译
c.人脸识别


structured learning 还属于一个广袤的未知世界。 regression 和classification还只是冰山一角。



e.Reinforcement Learning  强化学习
从评价和反馈中学习

reinforcement learning实在没有大量输入数据给我们进行训练学习的情况下,才进行的,
就像alpha go,先收集所有围棋高手的棋谱,进行supervised learning,直到棋谱训练完成后。
再自己跟自己下棋,进行reinforcement learning 不断优化。

阅读更多

没有更多推荐了,返回首页