快速理清机器学习
机器学习方法就是计算机利用已有数据,得出了某种模型,并利用此模型预测未来的一种方法。
机器学习模型
因变量 我们希望预测的结果
自变量 用来预测的输入
机器学习一些领域
-
模式识别=机器学习
数据挖掘=机器学习+数据库
- 数据挖掘算法就是机器学习的算法在数据库中的优化 统计学习=机器学习
- 区分:统计学习重点在于统计模型的发展与优化,机器学习更在乎解决问题 计算机视觉=图像处理+机器学习
- 图像处理技术用于把图像作为机器学习模型中的输入,机器学习负责从图像中识别出相应模式。
- 识图/手写字符识别/车牌识别
语音识别=语音处理+机器学习
-
自然语言处理=文本处理+机器学习
- 自然语言处理即为让机器理解人类的语言,自然语言处理中大量使用编译原理相关的词法分析、语法分析,在理解层面使用到了语义理解与机器学习
机器学习算法
-
1 回归算法
- 线性回归:拟合一条直线最佳匹配所有数据(最小二乘法)
- 逻辑回归:属于分类算法,预测结果是离散的分类 在线性回归的基础上加一个sigmoid函数来计算概率(垃圾邮件/广告的判断)
(数值计算学科:专门提升计算机在各类计算时的准确性和效率问题 梯度下降/牛顿法)
-
2 神经网络
- 一个简单的神经网络分为输入层、隐藏层和中间层,输入层接收信号,隐藏层对数据分解和处理,最后的结果由输出层输出。由若干个处理单元组成一层,若干层组成一个网络。每个处理单元都是一个逻辑回归模型,接收上层输入,模型预测结果作为输出传输到下一层,越深的层次处理的细节越小,通过这样的过程完成复杂的线性分类。 3 SVM支持向量机
- 诞生于统计学习的经典算法,算是逻辑回归算法的强化,用更严格的优化条件,获得更好的分类界线。与函数结合可以表达出非常复杂的分类界限
- 高斯核 :低维空间映射到高维空间,也就是说,二维平面划分出的非线性分类界线可以等价于三维平面的线性分类界限。 4 聚类算法
- 无监督算法:训练数据不含标签,通过训练推测出数据的标签。典型代表聚类算法
- 聚类算法:计算种群间的距离,根据距离远近将数据划分为多个族群(典型代表K-Means) 5降维算法
- 无监督学习算法,将数据从高维降低到低维,这里维度表示数据特征量的大小(典型代表PCA) 6推荐算法
- 物品内容推荐/用户相似度推荐
- 协同过滤算法
机器学习子类——深度学习
具有多个隐藏层的神经网络称为深度神经网络,基于深度神经网络的研究称为深度学习