python学习日志 10.9
sk-learn估计器
sklearn中进行特征工程时,大部分方法都是继承自转换器(transformer),需要先生成一个转换器实例,再调用fit_transform
方法。
常见的监督学习算法则是继承自估计器类(estimator),所以在化身调包侠的时候,需要先生成一个estimator实例,在调用fit
方法进行学习生成模型。predict
方法则是用生成的模型对测试集进行估计。
KNN算法
一种分类算法,定义是如果一个样本在特征空间中的k个最相似(即最邻近)的样本大多属于某一类,则这个样本属于某一类。
即将某一个样本划归到它最邻近样本的种类当中。
调用KNN算法:
from sklearn.neighbors import KNeighborsClassifier
其中,KNeighborsClassifier
支持一个n_neighbors
参数来确定算法的k取值。
在生成一个estimator实例后,可以通过estimator.fit(x_train,y_train)
来对训练集进行训练。在此之前,我们应该完成特征提取、降维、标准化等工作。
完成学习后,可以调用estimator.predict
方法来对测试集的数据进行估计,或者使用estimator.score
来计算测试集的正确率。