2019年06月_Lyumi

06月 03月 02月 01月

原创 26、27 K-Means

K-Means:非监督，聚类。过程：1、随机抽取K个中心点；2、所有点就近（常用欧式距离）分配成K个类，再重新计算每个类的中心点（平均值）；3、重复2，直至类不发生变化，或是达到设定的最大迭代次数。使用sklearn的K-Means:from sklearn.cluster import KMeansK-Means类构造函数：KMeans(n_clusters=8, init='...

2019-06-18 10:13:47 154

原创 24、25 KNN及实例

K近邻原理：1、计算待分类物体与其他已知物体的距离2、找出距离最近的K个邻居3、这K个邻居中，属于哪个分类的最多，则待分类物体属于哪类。K值的选择K不能过小，否则可能会因为噪声而产生分类误差，分类过拟合；K也不能过大，鲁棒性强，但会欠拟合。K值是工程实践得到的，。交叉验证将样本集中大部分样本作为训练集，剩余的部分做测试集，来验证分类模型的准确性，K值一般选取在较小范围内，并且...

2019-06-12 20:12:44 205

原创 22、23 SVM支持向量机概念及实例

SVM是有监督学习模型，可以进行模式识别、分类及回归分析。工作原理：SVM就是找到一个超平面，将样本划分开，并且使样本集中的样本点到这个分类超平面的最小距离（分类间隔）最大化。n维空间超平面的数学表达式为：上图中di是样本点xi到超平面的欧氏距离，目的是求di的最小值，作为该样本到超平面的最短距离。SVM的目标就是找出所有分类间隔中最大的值对应的最优超平面。硬间隔：完全线性可分，找...

2019-06-11 20:24:02 224

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人