2-推荐系统之机器学习基础
1.机器学习的主要分类
- **有监督学习:**提供数据并提供数据对应结果的机器学习过程
- 包含
- 分类
- 回归
- 包含
- 无监督学习:提供数据并且不提供数据对应结果的机器学习过程
- 包含
- 聚类
- 分组
- 包含
- 强化学习: 通过与环境交互并获取延迟返回进而改进行为的学习过程
2.监督学习三要素
-
模型
总结数据的内在规律,用数学函数描述的系统
-
策略
选取最优模型的评价准则
-
算法
3.模型评估策略
- 模型评估
- 训练集和测试集
- **损失函数:**用来衡量模型预测误差的大小
- **经验风险:**模型f(x)关于训练数据集的平均损失称为经验风险
- 训练误差与测试误差
- 过拟合与欠拟合
- 正则化:
- 结构风险最小化(SRM)
- 在ERM的基础上,防止过拟合提出的策略
- 在经验风险上加上表示模型复杂度的正则化项,或者叫惩罚项
- 正则化项目一般是模型复杂度的单调递增函数,即模型越复杂,正则化值越大
- 结构风险最小化的典型例子就是正则化。
- 结构风险最小化(SRM)
- 交叉验证
4.精准率与召回率
- 精准率
P = TP/(TP + FP)
精确率是指“所有预测为正类的数据中,预测正确的比例”
- 召回率
R = TP/(TP + FN)
召回率是指“所有实际为正类的数据中,被正确预测找出的比例”