机器学习之一句话解释关键概念

最新推荐文章于 2024-06-23 09:51:01 发布

sandyzhs

最新推荐文章于 2024-06-23 09:51:01 发布

阅读量2.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习

本文链接：https://blog.csdn.net/sandyzhs/article/details/46741087

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文为机器学习初学者提供了一套简洁易懂的概念介绍，涵盖了从基础先行知识到具体算法的解释，包括决策树、K均值聚类、熵等核心概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器学习中，很多算法是很复杂的，很难容易的形象的解释，但是也有很多是算法复杂，但是理解起来简单。本文试图把学过的一些知识逐步有系统的用一二句话给小白解释清楚，一二句话解释不清楚的，也不勉强，我会给出高手文章的链接或者我自己日记的链接，希望这个页面作为自己的一个系统化的备忘，以及小白的简单入门。

另外，这个页面是逐步更新的。

机器学习基础

先行知识
凸优化convex optimization
概率论probability theory
贝叶斯理论Naive Bayesian Theory
信息论 information theory

有监督的算法 supervised
决策树 decision tree

和数据结构的树是一样的，条件的组合决定样本的分类；就是像你想的那么简单，别想复杂了。提醒一点：不一定非要是二叉树啊。

无监督算法unsupervised
k均值 k-means

把数据按照距离的远近分为K（k未知）个分组，每个分组的中心点位该组数据的平均值。

k-medoids.

类似于k-means来根据距离进行分组，但是中心点不是平均值而是最中间的那个点。

关于k-means和k-medoids的区别和联系，这个文章写的不错：http://blog.pluskid.org/?p=40

基于密度的聚类算法 DBSCAN(Density-Based Spatial Clustering of Application with Noise) .here.

把密度大（单位体积内数据点比较多）的区域内的点作为一个分组，作为核心点，外围是边界点，不归属于任何区域的作为噪音点。

其他关键技术
熵 Entropy

熵是阻碍众多人理解信息论的难点，没有之一。而当年力劝香农（Shannon）使用这个概念的冯-诺依曼（von Neumann ，现代计算机奠基人）绝对是罪魁祸首，没有之一。原本香农准备用位（bit）的，那样该多好。

熵是度量信息（数据）不确定性的单位。比如猜东西，某个信息提示10下才能猜对就比另外信息提示两下就能猜对的信息不确定性高，熵也就大。

稍微详细的入门解释请移步查看吴军写的《数学之美》第六章：信息的度量和作用，包你明白。

损失函数 loss function

损失函数是关键概念，因为它是优化的目标函数。寻找最优的分类或回归函数的时候，很多时候我们是很难对目标函数f(x)做优化甚至做计算的，但是如果转换一下思路：最好的结果就是那些能让错误的结果最少的，错误总和最小的，于是出现损失函数来计算错误的分类情况；做优化的时候，只要找到损失函数的最小值，也就找到了目标函数f(x)。一般说来，损失函数是凸函数（注意：中国的凸函数是口朝上的，外国的口朝下的），而凸函数有很好的优化算法和收敛性。