KNN 近邻分类案例实战 (监督学习)
目录
02 k折交叉验证(k-fold cross validation)
一、概念
KNN近邻分类算法(监督学习)
KNN算法从训练集中找到和新数据最接近的K条记录,然后个努努他们的主要分类来决定新数据的类别。
二、训练方法要点
01 训练集和测试集
train_test_solit 是交叉验证中的常数,功能是从样本中随机的按照比例选取train_data 和test_data.
X_train,X_test,Y_train,y_test=cross_validation.train_test_split(train_data,train_target,test_size=0.4,random_state=0)
cross_validation为交叉验证
参数解释:
train_data:索要划分的样本特征集
train_target 索要划分的样本结果
test_size 样本占比,如果是整数的话就是样本的数量
random_state:是随机数的种子。
02 k折交叉验证(k-fold cross validation)
sklearn.cross_valodation.cross_val_score(estimator,X,y=None,scoring=None,cv=None,n_jobs=1,verbose=0,fit_params=None,pre_dispatch='2*n_jobs')
estimator :特征数据集
X 数据
Y 预测数据
soring