机器学习论文中完全看不懂的数学公式该怎样才能看懂？

最新推荐文章于 2025-03-12 16:38:43 发布

一只揪°

最新推荐文章于 2025-03-12 16:38:43 发布

阅读量5.1k

点赞数 5

分类专栏：联邦学习文章标签：机器学习聚类算法

原文链接：https://www.zhihu.com/question/403389924/answer/1301853537

版权

联邦学习专栏收录该内容

4 篇文章

订阅专栏

本文介绍了如何理解机器学习论文中复杂的数学公式，强调从宏观层面把握算法的作用、输入输出和超参数。文章建议关注算法的分类、目标和输入输出特性，而非过分纠结于细节公式。同时，推荐使用Python的sklearn库实践机器学习算法，以加深对公式的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在看论文的时候，感觉很多公式包括符号和运算符都很复杂，没办法看懂公式的含义并且不知道公式作用是什么？希望尝试运用以下的方法能够好好的学习一下论文当中的公式，不知道实践一个月后会不会有什么效果。
遇到机器学习论文中完全看不懂的数学公式该怎样才能看懂，有没有什么工具可以推导解释计算的啊？

公式看不懂有以下几点原因：

数学符号没有接触过
变量符号没懂
基础不扎实
不知道怎么构造的

一些建议

一些建议
建议是对于机器学习，更多的是从宏观上了解该某个机器学习方法的作用是什么？输入是什么？输出是什么？可调节的超参数是什么？各个超参数的含义是什么？对于具体的数学公式其实不必做过多的纠结，更多的是理解数学公式背后的物理含义和数学意义。

比如某个机器学习方法的作用是什么？

其实无外乎两大类：监督学习和非监督学习，监督学习又分为分类和回归，非监督学习又分为聚类、降维。因此，对于某个特定的机器学习方法，只要分清它是分类还是回归，抑或是聚类还是降维就可以运用算法了。比如常见的分类算法包括Logistic Regression，Decision tree等，回归算法包括神经网络、线性回归等，聚类包括K-means和DBSCAN，降维主要是PCA。了解各个算法的分类后，就能知道各个算法的作用是什么，具有相同作用的算法在一定程度上是可以互相替代的，只不过针对不同的数据集特征，可能某一算法会表现出更好的学习效果。

输入输出是什么？

对于所有算法，输入都是数据集的特征，不同的在于算法的输出和训练样本。对于分类算法，输出是样本所在的类别；对于回归算法，输出是一个连续空间上的任意实数；因为分类和回归算法都是监督学习范畴，所以训练样本是包含标签的，也就是训练样本是包含输出值的。对于聚类算法，输出同样是样本的类别，不过和分类算法不一样的地方在于，聚类是无监督学习，因此它的训练样本是不包含输出值的。对于降维算法，输出是降维后的样本特征，同样它的训练样本也是不包含输出值的。

可调节的超参数是什么？超参数的含义是什么？

这个也是不同机器学习算法的核心所在，比如k-means算法中可调节的超参数包括聚类中心的数目、样本点间距的度量方法等，其中聚类中心的数目规定了将样本自动划分为几类，显然聚类中心数越多，样本会被分的越精细，但会丢失对样本共性特征的挖掘；若聚类中心数很少，样本被分的越粗，不能体现出各聚类结果间的差异性，因此需要对聚类中心的数目进行试错或通过特定方法进行确定。样本点间距的度量方法包括几何度量、绝对值度量等，它定义了样本间差异性的度量规则，不同的度量规则可能导致不同的聚类结果。
了解了上述基本概念后，实际上就可以利用Python中提供的sklearn库做自己的机器学习算法啦。sklearn库对目前绝大部分机器学习算法做了封装，使用起来特别简单，只要给定输入输出，指定超参数，系统就能自己进行模型参数的学习和训练而常见论文中的公式，大部分都是抄的，并不是真的写了那么复杂的代码，实际上代码都是用的第三方库。