浅谈机器学习用来做什么，它是如何工作的

最新推荐文章于 2024-06-26 17:19:53 发布

vagrantabc2017

最新推荐文章于 2024-06-26 17:19:53 发布

阅读量2.6k

点赞数

分类专栏：深度学习文章标签：机器学习

本文链接：https://blog.csdn.net/vagrantabc2017/article/details/77584229

版权

深度学习专栏收录该内容

27 篇文章 0 订阅

订阅专栏

基本方程：Ax=b
本质上讲，机器学习需要基于算法系统，通过‘优化’去让等式的误差达到最小。
这里关注参数向量（权重）x的变化，直到找到一组适当的x值，使模型输出最接近真实输出。
当损失函数计算结果后，x就再次调整，缩小损失，直到极值点。
一个描述每个权重所带来的误差的误差矩阵会与权重矩阵本身相乘。
SDG是最基本的优化算法。
正则化和学习率属于模型的超参数，超参数的设置常常需要经验。
一些基本概念，描述了机器学习/深度学习可以干什么：

回归Regression：指通过自变量去估计因变量，预测真实值。简单讲就是预测。
回归解决“多少”的问题。
常见的是线性回归模型，如Ax=b.
矩阵形式：y = a + Bx ， a为函数图形与Y轴交点到原点距离
扩展形式：y = a + b0 * x0 + b1 * x1 + . . . + bn * xn
以散点图表示，预测的直线表示与所有的点的距离最短。
拟合Fitting：指用预测值f(x)去尽可能的接近真实值y. 相关的概念还有过拟合和欠拟合。
在Ax=b中，想求出x，有三个组件：
1. 内乘
2. 成本函数，常见的用（预测-实际）的平方。
3. 更新函数，即成本函数的导数。
非线性回归模型：
线性回归模型中，x的指数是1，非线性回归模型处理x指数大于1的情况，因而机器学习常被称为曲线拟合。
但完美的曲线拟合往往意味着过拟合，没有泛化和预测能力。

分类Classification：
分类解决“是什么”的问题。如5个苹果，“5个”是回归模型，“苹果”（而不是梨子）是分类问题。
分类基于输入的特征(features)，去回答是什么的问题。
基础的分类是2值分类。在0-1分类中，以0.5为分界。单输出NN模型
N值分类中，可以为每个值打分。多输出NN模型。
分类可应用于推荐系统，基于用户的相拟性或物品的相拟性。
最有名的是亚马逊的协作过滤(Collaborative Filtering)推荐算法，算是分类的变体。

聚类Clustering：
属于无监督学习算法，汉语上分类和聚类正好相反。但都是处理分类的问题，只是方法上不太一样。
它首先对每个样本有个距离的度量，距离相拟的样本是相拟的。然后迭代的移动这些样本，让它们靠得更近，结果形成了N个堆堆。
K-means算法是聚类的一个变体。