特征工程概念 N合
1 特征提取 feature extraction 从原始数据中提取与任务相关的特征
2 特征预处理 feature preprocessing 特征对模型产生影响;‘因量纲’(单位)问题,有些特征对模型影响大、有些影响小
3 Feature decomposition 特征降维 将原始数据的维度降低,叫做特征降维
4 feature selection 特征选择 原始数据特征很多,但是对模型训练相关是其中一个特征集合子集。
5 特征组合 feature crosses 把多个的特征合并成一个特征。一般利用乘法或加法来完成
KNN(核心思想‘聚类’物以类聚)
欧式距离公式
分类问题(离散型)
代码展示
# tdo 1.导包 from sklearn.neighbors import KNeighborsClassifier def dm01_knnapi(): x = [[0], [1], [2], [3]] y = [0, 0, 1, 1] estimator = KNeighborsClassifier(n_neighbors=3) estimator.fit(x,y) myret = estimator.predict([[4]]) print('myret->',myret)
回归问题(连续型)
代码展示
from sklearn.neighbors import KNeighborsRegressor def dm02_knnapi_回归(): estimator = KNeighborsRegressor(n_neighbors=2) X = [[0, 0, 2], [1, 7, 0], [5, 10, 10], [4, 17, 2]] y = [0.1, 0.2, 0.3, 0.4] estimator.fit(X, y) myret = estimator.predict([[5, 15, 20]]) print('myret-->', myret) dm02_knnapi_回归()