1. 什么是机器学习?
1.1. 本质
根据历史看到的样本,总结规律。
1.2. 机器学习 VS 专家规则
| 机器学习 | 专家规则 | 说明 |
样本 | 全量样本 | 抽样样本 (优点:最少数据获得最多信息 |
|
规律 | 海量规则 (特征更多,规律更精细) | 几百条规则 | 规则: 特征的多少决定了分类的个数 |
总结 | 机器总结 (能够看海量样本,总结海量规则的核心原因) | 专家总结 |
|
| 收纳尽可能多的数据,挖掘长尾价值 | 选取最有效的数据,发挥头部价值 |
|
1.3. 机器学习基本原理
定义一个损失函数(错误率),尝试所有的划分方法,取损失函数最小的划分方法。
举例说明:Linear Regression(单变量线性回归)
步骤 | 函数 | 含义 | 公式 | 说明 |
1 | 假设函数 | 模型 | x是特征 | |
2 | 损失函数 | 衡量预测值和真实值的差距 | 求解θ0,θ1, | |
3 | 梯度下降法 |
| 找到损失函数的局部极小值点 |
|
实际问题
问题 | 解决方法 |
穷举划分方法,导致计算量太大 | Mini batch |
过拟合 | 正则惩罚 |