- 重点内容:机器学习
1.1 机器学习
对于机器学习并没有统一的定义,下述给出几个经典的定义可供理解
Arthur Samuel,他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。
Samuel的定义是基于他自己编写的西洋棋程序,让西洋棋程序通过上万对局的观察,能够分析出布局的利弊,通过大量对局的练习,计算机获得无比丰富的经验,于是渐渐成为了比Samuel更厉害的西洋棋手。
Tom Mitchell定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验E中学习,解决任务T**,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。即是说计算机程序从经验E中学习,解决某一任务T,进行某一性能P,通过P测定在T上的表现因经验E而提高
1.2 监督学习
1.2.1 定义
利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
1.2.2 例1:预测房价(回归问题)
回归问题目的: 预测连续的数值输出
1. 用直线拟合
2. 用二次函数或二阶多项式拟合(效果更佳)
1.2.3 例2:预测肿瘤是良性或恶性(分类问题)
分类问题目的: 预测离散值输出。
就本问题而言,结果只有0和1的输出。
1. 只有一个特征时
2. 有两个特征时
3. 算法最终的目的是解决无穷多个特征的数据集
1.3 无监督学习
1.3.1 无监督学习定义
只给算法一个数据集,但是不给数据集的正确答案,由算法自行分类。
1.3.2 聚类算法
谷歌新闻每天收集几十万条新闻,并按主题分好类
市场通过对用户进行分类,确定目标用户
鸡尾酒算法:两个麦克风分别离两个人不同距离,录制两段录音,将两个人的声音分离开来(只需一行代码就可实现,但实现的过程要花大量的时间)