![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 94
data_xzh
life is ......
展开
-
KNN(分类)算法及案例
1 背景KNN算法采用测量不同特征值之间的距离方法进来分类,思想类似成语近朱者赤近墨者黑。1.1 KNN流程最常用的度量距离方法是欧式距离,即计算测试集与待预测数据差值的平方和开方(1)。若多维度数据数值范围差异较大,需要先对所有数据进行标准化(2)或归一化(3)处理. ...原创 2018-09-08 18:18:18 · 33915 阅读 · 16 评论 -
分类算法(决策树、逻辑回归、线性SVC、SVC)模型的耗时测试
初学数据挖掘算法时,在具体工作中常常不清楚如何选择算法,本文将从耗时的角度进行测试,选择的基础算法有DecisionClassifier、LogisticRegression、LinearSVC、SVC(高斯核函数)。并没有再用SVC(kernel = linear)作对比,LinearSVC就够了。数据集使用的是sklearn.datasets中的make_moons,下图中数据加入10%噪...原创 2019-03-11 17:28:20 · 2237 阅读 · 1 评论