机器学习
嗯哼自信点
这个作者很懒,什么都没留下…
展开
-
K-Means算法(python实现)
k-means 计算过程 估计样本中的总分类个数KKK 随机选取K个聚类质心点μ1,μ2,⋯ ,μk\mu_1,\mu_2,\cdots,\mu_kμ1,μ2,⋯,μk 对于每一个样本,分别计算到每个质心点的距离d1,d2,⋯ ,dkd_1,d_2,\cdots,d_kd1,d2,⋯,dk,取最近的一个距离,作为该样本暂时所属的分类k。可以选择euclidean距离作为参考依据。至此,每个样本都归入某个类别下 对于每个类别,计算其所辖的每个样本到其质心的距离之和,作为累积距离偏差WkW_k转载 2020-05-24 10:10:51 · 931 阅读 · 0 评论 -
信息熵,信息增益详解
信息熵 信息熵的意义 信息熵主要研究的是对一个信号能够提供信息的多少进行量化。1948年,香农引入信息熵,将其定义为离散随机事件的出现概率。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。所以说,信息熵可以被认为是系统有序化程度的一个度量 信息熵的定义 如果一个随机变量YYY的可能取值为:X=y1,y2,⋯ynX={y_1, y_2,\cdots y_n}X=y1,y2,⋯yn,其概率分布分别为:P(yi)P(y_i)P(yi)。则随机变量YYY的熵定义为: H(Y)=∑i=1转载 2020-05-22 19:26:19 · 2356 阅读 · 1 评论