一.特征工程的概念
利用专业背景知识和技巧处理数据,让机器学习算法效果最好。这个过程就是特征工程.
二.特征工程的设计内容(用图来表示)
三.拟合
欠拟合产生的原因:模型过于简单
过拟合产的原因:模型太过于复杂、数据不纯、训练数据太少
四.泛华
泛化 Generalization :具体的、个别的扩大为一般的能力。
奥卡姆剃刀原则:给定两个具有相同泛化误差的模型,倾向选择较简单的模
型。
利用专业背景知识和技巧处理数据,让机器学习算法效果最好。这个过程就是特征工程.