机器学习笔记3：分类——练习题

Ruoki~

已于 2022-08-31 20:34:16 修改

阅读量628

点赞数 1

分类专栏：机器学习文章标签：机器学习分类 python

于 2022-08-29 09:31:12 首次发布

本文链接：https://blog.csdn.net/Ruo_ki/article/details/126577844

版权

1.为MNIST数据集构建一个分类器，并在测试集上达成超过97%的准确率。提示：KNeighborsClassifier对这个任务非常有效，你只需要找到合适的超参数值即可（试试对weightsn_neighbors这两个超参数进行网格搜索）。

如果你了解knn算法，你会清楚知道这个算法是多么的耗时，大数据量+网格搜索+交叉验证，一套下来需要十多个小时

from sklearn.model_selection import GridSearchCV

param_grid = [{'weights': ["uniform", "distance"], 'n_neighbors': [3, 4, 5]}]

knn_clf = KNeighborsClassifier()
grid_search = GridSearchCV(knn_clf, param_grid, cv=5, verbose=3)
grid_search.fit(X_train, y_train)

grid_search.best_params_
## {'n_neighbors': 4, 'weights': 'distance'}

grid_search.best_score_
## 0.9716166666666666

from sklearn.metrics import accuracy_score

y_pred = grid_search.pre