![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
文章平均质量分 60
_almost_
这个作者很懒,什么都没留下…
展开
-
回归算法——python实现线性回归
算法简介给定数据集D={(x1,y1),(x2,y2),…,(xm,ym)},一共有m个样本,其中每个样本有d个属性,即xi = (xi1,xi2,…,xid)。线性回归是试图学到一个线性模型 f(x) = w1*x1+w2*x2+…+wd*xd + b以尽可能准确的预测实值输出标记。 其中w=(w1,w2,…,wd), w和b是通过学习之后,模型得以确定。 w和b的确定是通过损失函数确定的:原创 2017-05-23 21:59:30 · 12969 阅读 · 1 评论 -
聚类算法——python实现密度聚类(DBSCAN)
算法思想基于密度的聚类算法从样本密度的角度考察样本之间的可连接性,并基于可连接样本不断扩展聚类簇得到最终结果。 几个必要概念: ε-邻域:对于样本集中的xj, 它的ε-邻域为样本集中与它距离小于ε的样本所构成的集合。 核心对象:若xj的ε-邻域中至少包含MinPts个样本,则xj为一个核心对象。 密度直达:若xj位于xi的ε-邻域中,且xi为核心对象,则xj由xi密度直达。 密度可达:若样原创 2017-05-15 17:41:07 · 29411 阅读 · 19 评论 -
聚类算法——python实现层次聚类(AGNES)
算法思想层次聚类是在不同层次上对数据进行划分,从而形成树状的聚类结构。 AGNES算法是自底向上的层次聚类算法。开始时将数据集中的每个样本初始化为一个簇,然后找到距离最近的两个簇,将他们合并,不断重复这个过程,直达到到预设的聚类数目为止。 计算距离的三个公式: AGNES算法根据上面个三个不同的公式,相应的被称为均链接,单链接和全链接。 算法步骤如下:将数据集中的每个样本初始化原创 2017-05-15 20:39:35 · 36022 阅读 · 1 评论 -
聚类算法——python实现学习向量量化(LVQ)算法
算法思想学习向量量化算法和K均值算法类似,是找到一组原型向量来聚类, 每一个原型向量代表一个簇,将空间划分为若干个簇,从而对于任意的样本,可以将它划入到与它距离最近的簇中。特别的是LVQ假设数据样本带有类别标记,可以用这些类别标记来辅助聚类。 大致思想如下: 1.统计样本的类别,假设一共有q类,初始化为原型向量的标记为{t1,t2,……,tq}。从样本中随机选取q个样本点位原型向量{p1, p2原创 2017-05-13 13:50:23 · 8368 阅读 · 2 评论 -
聚类算法——python实现k-means算法
算法思想通俗的说,就是把一些样本按照相似度分成k类。给定样本集D={x1, x2, x3, ……, xm}, 划分为k类得到集合C = {C1, C2, ……, Ck},(其中Ci,1<=i<=k, 是包含若干个样本xi, 1<=i<=m, 的集合,使得平方误差最小化,即其中 ui是Ci类中所有样本的均值向量。但是最小化E是一个NP难问题, 所以采用了迭代优化的方式来近似求解。大致思想如下:从样原创 2017-05-11 15:54:09 · 1257 阅读 · 0 评论 -
聚类算法——python实现SOM算法
算法简介SOM网络是一种竞争学习型的无监督神经网络,将高维空间中相似的样本点映射到网络输出层中的邻近神经元。训练过程简述:在接收到训练样本后,每个输出层神经元会计算该样本与自身携带的权向量之间的距离,距离最近的神经元成为竞争获胜者,称为最佳匹配单元。然后最佳匹配单元及其邻近的神经元的权向量将被调整,以使得这些权向量与当前输入样本的距离缩小。这个过程不断迭代,直至收敛。网络结构:输入层和输出层(或竞争原创 2017-05-18 10:24:50 · 24737 阅读 · 19 评论