机器学习

最新推荐文章于 2024-04-26 19:54:58 发布

qq_43363200

最新推荐文章于 2024-04-26 19:54:58 发布

阅读量230

点赞数

原文链接：https://www.cnblogs.com/subconscious/p/4107357.html

版权

从机器学习谈起

什么是机器学习

依据数据做判断
一般的机器学习模型至少考虑两个量：一个是因变量，也就是我们希望预测的结果，另一个是自变量，也就是用来预测的量。
决策树模型
多自变量
线型回归方法建立模型
机器学习方法是计算机利用已有的数据(经验)，得出了某种模型(迟到的规律)，并利用此模型预测未来(是否迟到)的一种方法。
机器学习界“数据为王”的思想。一般来说(不是绝对)，数据越多，最后机器学习生成的模型预测的效果越好。

范围

模式识别
模式识别源自工业界，而机器学习来自于计算机学科。不过，它们中的活动可以被视为同一个领域的两个方面
数据挖掘
统计学习
计算机视觉
图像处理+机器学习
语音识别
自然语言处理
文本处理+机器学习

回归算法

线性回归

最小二乘法——梯度下降法
线性回归处理的是数值问题，最后预测出的结果是数字。

逻辑回归

线型回归处理的问题类型与逻辑回归不一致。
逻辑回归属于分类算法，预测结果是离散的分类，例如判断这封邮件是否是垃圾邮件，以及用户是否会点击此广告等等。

逻辑回归算法划出的分类线基本都是线性的(也有划出非线性分类线的逻辑回归，不过那样的模型在处理数据量较大的时候效率会很低)，这意味着当两类之间的界线不是线性时，逻辑回归的表达能力就不足。

ANN 人工神经网络

Artificial Neutral Network
分解与整合
简单的神经网络的逻辑架构分成输入层，隐藏层，和输出层。
输入层负责接收信号，隐藏层负责对数据的分解与处理，最后的结果被整合到输出层。
每层中的一个圆代表一个处理单元，可以认为是模拟了一个神经元，若干个处理单元组成了一个层，若干个层再组成了一个网络，也就是"神经网络"。

SVM（支持向量机）

将数据从低维映射到高维

SVM 支持向量机

聚类算法

训练数据不含标签，而是通过训练，推测出这些数据的标签。这类算法有一个统称，即无监督算法(前面有标签的数据的算法则是有监督算法)。无监督算法中最典型的代表就是聚类算法。
聚类算法就是计算种群中的距离，根据距离的远近将数据划分为多个族群。

降维算法

降维算法也是一种无监督学习算法。
将数据从高维降低到低维层次。
维度表示的是数据的特征量的大小，例如，房价包含房子的长、宽、面积与房间数量四个特征，也就是维度为4维的数据。可以看出来，长与宽事实上与面积表示的信息重叠了，例如面积=长 × 宽。通过降维算法我们就可以去除冗余信息，将特征减少为面积与房间数量两个特征，即从4维的数据压缩到2维。
刚才说的降维过程中减少的维度属于肉眼可视的层次，同时压缩也不会带来信息的损失(因为信息冗余了)。
如果肉眼不可视，或者没有冗余的特征，降维算法也能工作，不过这样会带来一些信息的损失。
降维算法可以从数学上证明，从高维压缩到的低维中最大程度地保留了数据的信息。
降维算法的主要作用是压缩数据与提升机器学习其他算法的效率。通过降维算法，可以将具有几千个特征的数据压缩至若干个特征。另外，降维算法的另一个好处是数据的可视化，例如将5维的数据压缩至2维，然后可以用二维平面来可视。降维算法的主要代表是PCA算法(即主成分分析算法)。

其他

高斯判别
朴素贝叶斯
决策树等等算法

子类——深度学习

传统的神经网络发展到了多隐藏层的情况

父类–人工智能

在这里插入图片描述

qq_43363200

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习

从机器学习谈起什么是机器学习依据数据做判断一般的机器学习模型至少考虑两个量：一个是因变量，也就是我们希望预测的结果，另一个是自变量，也就是用来预测的量。决策树模型多自变量线型回归方法建立模型机器学习方法是计算机利用已有的数据(经验)，得出了某种模型(迟到的规律)，并利用此模型预测未来(是否迟到)的一种方法。机器学习界“数据为王”的思想。一般来说(不是绝对)，数据越多，最后机器学习生成的模型预测的效果越好。范围模式识别模式识别源自工业界，而机器学习来自于计算机学科。不过，它们中的活
复制链接

扫一扫