1.特征工程(FeatureEngineering)
特征工程是指利用专业背景知识和技巧处理数据,让机器学习算法效果最好。这个过程就是特征工程。
2.模型拟合
拟合fitting:用来表示模型对样本分布点的模拟情况。
泛化Generalization:模型在新数据集(非训练数据)上的表现好坏的能力。•奥卡姆剃刀原则:给定两个具有相同泛化误差的模型,较简单的模型比较复杂的模型更可取。
3. KNN算法
•解决问题:分类问题、回归问题
•算法思想:若一个样本在特征空间中的k个最相似的样本大多数属于某一个类别,则该样本也属于这个类别
相似性:欧氏距离
K值的选择:
K值过小:用较小邻域中的训练实例进行预测容易受到异常点的影响K值的减小就意味着整体模型变得复杂,容易发生过拟合
K值过大:用较大邻域中的训练实例进行预测受到样本均衡的问题且K值的增大就意味着整体的模型变得简单,欠拟合
KNN算法API使用 模拟回归
他奶奶的配环境终于成功了!!!!!!!!!!!!