- 博客(4)
- 收藏
- 关注
原创 机器学习笔记三之模型迭代优化遇上过拟合
特征选择与删除:分析特征的重要性,可以使用特征选择方法(如基于模型的特征重要性)来选择最具有预测能力的特征,也可以删除一些对模型性能影响较小的特征。特征组合与交互:将不同特征进行组合、相乘、相除等操作,创建新的特征,以捕捉特征之间的复杂关系。数值型特征的分桶(Binning):将连续的数值型特征划分为多个区间,可以提高模型对特征的鲁棒性。类别型特征的编码:除了One-Hot编码外,可以尝试使用其他编码方式,如Label Encoding、Target Encoding等,来更好地处理类别型特征。
2023-08-25 01:42:01 111
原创 机器学习笔记二(任务二)
探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律了解数据集,了解变量间的相互关系以及变量与预测值之间的关系的一种数据分析方法。可以进一步了解变量间的相互关系以及变量与预测值之间的存在关系。引导进行数据处理以及特征工程的步骤,使数据集的结构和特征集让预测更合理。
2023-08-23 21:48:49 125
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人