机器学习
机器学习知识体系介绍
- 机器学习与规则编写程序的区别
- 机器学习原理图
- 机器学习的学习路径和方法
- 机器学习需要哪些知识
- 概率统计与机器学习之间的关系
- 推荐参考书籍
1. 机器学习与规则编写程序的区别
1.5 传统规则程序与机器学习区别
- 解决方案需要规则列表超长问题,通过机器学习可以简化代码, 提升执行表现
- 对于传统技术手段根本无法解决的复杂问题,通过机器学习可以 找到方案
- 对于环境波动:机器学习系统可以适应新的数据
- 从复杂问题和海量数据中获得更多人类未曾意识到的关联性或者 趋势
2. 机器学习原理图
3. 机器学习学习路径和方法
4.1 机器学习需要哪些知识
4.2 机器学习中的基础概念
-
• 微积分基础
- 泰勒公式
- 导数与梯度
-
• 概率与统计基础
- 概率公式
- 常见分布
- 常见统计量
-
• 线性代数基础
- 矩阵乘法的几何意义
5. 概率统计与机器学习的关系
-
• 统计本质是分布,机器学习训练出来的是模型,模型可能包含了很 多分布
-
• 训练与预测过程的一个核心评价指标就是模型的误差
-
• 误差本身就可以是概率的形式,与概率紧密相关。
-
• 对误差的不同定义方式就演化成了不同损失函数的定义方式。
-
• 机器学习是概率与统计和计算机编程的结合
6. 推荐书籍
总结
- 机器学习模型本质就是一个函数,函数运算所有的特征,得到一个值
- 数据挖掘基本等于机器学习,统计学是机器学习的子集,凹集,模式识别也 是约等于数据挖掘,原始的模式识别更接近于匹配和规则,现在的机器学习 更偏重于统计
- 统计是取出一部分数据,得知分布情况,求全集的分布情况。统计是对全量 的一种关测,所以成本会很少,如果能用抽样解决的问题,尽量不要用机器 学习来做,机器学习成本比较高,一般用统计和概率弄一下就可以了
- 数据挖掘建模之前需要对数据进行清洗处理 ,了解数据的关联性很重要, bat的数据挖掘组,需要在进入之前,在数据组轮值半年岗
机器学习分类
- 机器学习应用领域
- 机器学习分类
- 监督学习
- 无监督学习
- 监督学习常用机器学习算法
- 无监督学习常用机器学习算法