- 博客(3)
- 收藏
- 关注
原创 26、27 K-Means
K-Means:非监督,聚类。过程:1、随机抽取K个中心点;2、所有点就近(常用欧式距离)分配成K个类,再重新计算每个类的中心点(平均值);3、重复2,直至类不发生变化,或是达到设定的最大迭代次数。使用sklearn的K-Means:from sklearn.cluster import KMeansK-Means类构造函数:KMeans(n_clusters=8, init='...
2019-06-18 10:13:47 154
原创 24、25 KNN及实例
K近邻原理:1、计算待分类物体与其他已知物体的距离2、找出距离最近的K个邻居3、这K个邻居中,属于哪个分类的最多,则待分类物体属于哪类。K值的选择K不能过小,否则可能会因为噪声而产生分类误差,分类过拟合;K也不能过大,鲁棒性强,但会欠拟合。K值是工程实践得到的, 。交叉验证将样本集中大部分样本作为训练集,剩余的部分做测试集,来验证分类模型的准确性,K值一般选取在较小范围内,并且...
2019-06-12 20:12:44 205
原创 22、23 SVM支持向量机概念及实例
SVM是有监督学习模型,可以进行模式识别、分类及回归分析。工作原理:SVM就是找到一个超平面,将样本划分开,并且使样本集中的样本点到这个分类超平面的最小距离(分类间隔)最大化。n维空间超平面的数学表达式为:上图中di是样本点xi到超平面的欧氏距离,目的是求di的最小值,作为该样本到超平面的最短距离。SVM的目标就是找出所有分类间隔中最大的值对应的最优超平面。硬间隔:完全线性可分,找...
2019-06-11 20:24:02 224
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人