复习
- 这个是是非题(其实就是一个二元分类器)
- 信用卡的是否分发。
- 电子邮件是否是垃圾邮件
- 病人是否生病
- 广告是否会赚钱
- 这个学生是否能够答对这一题
机器学习种类
多类机器学习
- 把你投入的硬币分类(1c, 5c, 10c, 25c)。
- y = {1c,5c,10c,20c} -> y = {1,2,…,K}
- 二元分类就是K = 2的时候
回归:病人预测问题
- 二元分类:病人是否生病。
- 多类分类:病人特征,是否得了癌症。
- 回归:病人能什么时候恢复。
- 这种方法在统计中非常重要,机器学习有非常多可以借鉴统计的工具。
自然语言辨识(自动词性标注)
- I(pronoun) love(verb) ML(noun).
- 把词分类,分成各个词性的类。
- 结构学习
- 如何通过句子得到结构。
- 如何通过结构特性得到结果。
- 蛋白质结构数据->得到蛋白质折叠情况。
- 语音数据->语音解析树
小总结
- 二元分类
- 多类分类
- 回归
- 结构学习
- 核心是变换输出Y的维度。
学习方式
监督学习
- 把所有硬币都正确的分类,告诉你硬币分类的定义。
非监督学习
- 不告诉你硬币的信息,让你对它进行聚类。
- 方法
- 聚类
- 密度估测(density estimation)
- 异常检测(outlier detection)
半监督学习
- 很多数据难以标签或者需要花很长时间标签。
- 就标注一部分,然后让机器去学习。
- 应用
- 脸部识别
- 药物识别(人体动物实验)
强化学习
- 训练动物、宠物,你没有办法直接和他沟通
- 但是你能够通过惩罚,你能让他明白他做了一个错误的判断。
- 你没有办法直接告诉他你做的是对的,但是你可以通过奖励或惩罚告诉他是否正确。
- “不是在原先的结果上做惩罚,而是在其他参数上进行奖励或惩罚”。
- 应用
- 网络广告系统(观众什么时候会点击广告)
- 棋类系统(下了这部棋,是赢是输)
- 学习的动作序列式的发生,呈现一个仿真的过程。
小总结
- 监督学习
- 非监督学习
- 半监督学习
- 强化学习