机器学习
-
数学基础
1.微积分
2.矩阵计算
3.线性代数
4.概率论
5.数理分析
传统机器学习算法:
1.K-近邻算法
2.决策树
3.朴素贝叶斯
4.逻辑回归
5.支持向量机
6.聚类
7.主成分分析 -
机器学习概念
- 从已知数据中总结经验规律,并对未知数据进行预测。
- E (经验 ——降低了可解释性)
- P(计算机程序的性能)
- T(任务)
-
机器学习算法分类
- 学习方式分类:
- 监督学习
- 目标值与预测值比较(有评价)
- 回归
- 分类
- 目标值与预测值比较(有评价)
- 非监督学习
- 聚类
- 降维
- 半监督学习
- 异常检测
- 强化学习
- 模型的超参
- 模型的优化
- 监督学习
- 学习方式分类:
-
机器学习基本术语:
- 特征(数据集列):index(不是特征)
- 维数、维度空间
- 泛化、归纳、演绎
-
模型评估
- 错误率
- E=错误数量再总样本的占比
- 准确率 A=1 -E
- 训练误差
- 测试误差
- 过拟合
- 错误率
-
判别方法:
- 误差
- 泛化
- 偏差
- 方差
-学习曲线
-
数据集的拆分
- 留出法、k折交叉验证法、自助法
- 数据集是随机抽取且独立同分布的
- 分布是平稳的,不随时间的变化而变化始终从一个分布取出
- 留出法8:2 取出为训练集和测试集
-
参数调节
- 调参
-
模型评价
- 分类模型的评价:
- 混淆矩阵
- 评价指标
- 准确率
- 精确率
- 召回率
- F1值
- 精确率和召回率权重一样·
- ROC 和AUC
- Roc
- 召回率和假正率
- Roc
- 回归模型的评价:
- 平均绝对误差
- 均方误差
- 均根方误差
- 决定系数
- 分类模型的评价:
Scikit-learn
-
分类
-
回归
-
聚类
-
数据降维
-
模型选择
- 网格搜索
- 交叉验证
- 预测误差
-
数据预处理(机器学习第一步)
- 特征提取
- 归一化
-
后记:
有需要的朋友可以搜索微信公众号:【知音库】
这里有个人总结的文章,本人是大数据专业学生,
同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。