机器学习篇-day01-机器学习相关概述
获取数据数据基本处理(缺失值, 非法值)特征工程(抽取专业词汇)(特征提取, 特征预处理, 特征降维, 选择, 合并)模型训练模型评估数据基本处理 和 特征工程最为耗时拟合:用来表示模型对样本点的拟合情况模型在训练集上表现很差、在测试集表现也很差原因:模型过于简单模型在训练集上表现很好、在测试集表现很差原因:模型太过于复杂、数据不纯、训练数据太少泛化:模型在新数据集(非训练数据)上的表现好坏的能力奥卡姆剃刀原则:给定两个具有相同泛化误差的模型,较简单的模型比较复杂的模型更可取。
原创
2024-09-28 20:19:51 ·
760 阅读 ·
0 评论