交叉验证的目的:为了让被评估的模型更加准确可信
这里的验证是训练的一部分,和测试集无关。
demo.py(K近邻分类算法,交叉验证,网格搜索,GridSearchCV):
import pandas as pd
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
# K近邻算法,预测用户入住哪个酒店
# 读取数据
data = pd.read_csv("./data/FBlocation/train.csv")
# print(data.head(3))
'''
row_id x y accuracy time place_id
0 0.