ai算法汇总

最新推荐文章于 2024-08-03 17:48:11 发布

qq_43159264

最新推荐文章于 2024-08-03 17:48:11 发布

阅读量743

点赞数 1

分类专栏：算法

本文链接：https://blog.csdn.net/qq_43159264/article/details/106455841

版权

算法专栏收录该内容

16 篇文章 0 订阅

订阅专栏

在这里插入图片描述

BIRCH算法

层次聚类

最大化期望算法（EM）

https://blog.csdn.net/guoziqing506/article/details/81274276

最大似然估计

最大似然其实基本的原理非常简单，假设我们手里现在有一个样本，这个样本服从某种分布，而分布有参数，可如果我现在不知道这个样本分布的具体参数是多少，我们就想要通过抽样得到的样本进行分析，从而估计出一个较准确的相关参数。

隐藏变量

我们看这样一个例子。假设现在班上有男女同学若干，同学们的身高是服从正态分布的，当然了，男生身高分布的参数与女生身高分布的参数是不一样的。现在如果给你一个同学的身高，你很难确定这个同学是男是女。如果这个时候抽取样本，让你做上面的最大似然估计，那么就需要做以下两步操作了：

估计一下样本中的每个同学是男生还是女生；
估计男生和女生的身高分布的参数；
第二步就是上面说的最大似然估计，难点在第一步，你还得先猜测男女才行。用更抽象的语言，可以这样描述：属于多个类别的样本混在了一起，不同类别样本的参数不同，现在的任务是从总体中抽样，再通过抽样数据估计每个类别的分布参数。这个描述就是所谓的“在依赖于无法观测的隐藏变量的概率模型中，寻找参数最大似然估计”，隐藏变量在此处就是样本的类别（比如上例中的男女）。这个时候EM算法就派上用场了。

k-means

可根据某算法求k，k最合适
https://blog.csdn.net/qiao_lili/article/details/83384476#2.%20K%E5%9D%87%E5%80%BC%E7%9A%84%E5%9F%BA%E6%9C%AC%E7%90%86%E8%AE%BA

k-median

k为中值
https://blog.csdn.net/chichoxian/article/details/84295289?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

与K-Means算法不一样的是，Mean Shift算法可以自动决定类别的数目。与K-Means算法一样的是，两者都用集合内数据点的均值进行中心点的移动。

Mean Shift聚类算法

https://blog.csdn.net/weixin_41521681/article/details/90168034
算法步骤:
下面是有关Mean Shift聚类算法的步骤：

在未被标记的数据点中随机选择一个点作为起始中心点center；
找出以center为中心半径为radius的区域中出现的所有数据点，认为这些点同属于一个聚类C。同时在该聚类中记录数据点出现的次数加1。
以center为中心点，计算从center开始到集合M中每个元素的向量，将这些向量相加，得到向量shift。
center = center + shift。即center沿着shift的方向移动，移动距离是||shift||。
重复步骤2、3、4，直到shift的很小（就是迭代到收敛），记住此时的center。注意，这个迭代过程中遇到的点都应该归类到簇C。
如果收敛时当前簇C的center与其它已经存在的簇C2中心的距离小于阈值，那么把C2和C合并，数据点出现次数也对应合并。否则，把C作为新的聚类。
重复1、2、3、4、5直到所有的点都被标记为已访问。
分类：根据每个类，对每个点的访问频率，取访问频率最大的那个类，作为当前点集的所属类。