自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Datawhale AI夏令营第三期 笔记3

类别型特征的编码:除了One-Hot编码外,可以尝试使用其他编码方式,如Label Encoding、Target Encoding等,来更好地处理类别型特征。特征选择与删除:分析特征的重要性,可以使用特征选择方法(如基于模型的特征重要性)来选择最具有预测能力的特征,也可以删除一些对模型性能影响较小的特征。数值型特征的分桶(Binning):将连续的数值型特征划分为多个区间,可以提高模型对特征的鲁棒性。特征组合与交互:将不同特征进行组合、相乘、相除等操作,创建新的特征,以捕捉特征之间的复杂关系。

2023-08-25 19:55:44 87

原创 Datawhale AI夏令营第三期 笔记2

1、任务内容编写代码回答下面的问题:字段x1至x8为用户相关的属性,为匿名处理字段。添加代码对这些数据字段的取值分析,那些字段为数值类型?那些字段为类别类型?对于数值类型的字段,考虑绘制在标签分组下的箱线图。从中提取小时,绘制每小时下标签分布的变化。对进行onehot,统计每个key对应的标签均值,绘制直方图。2、具体实践③提取小时并绘制每小时下标签分布的变化。④对udmap进行onehot,统计每个key对应的标签均值,绘制直方图。

2023-08-23 19:30:33 80

原创 Datawhale AI夏令营第三期 笔记1

t=N6B9t=N6B9t=N6B9t=N6B9什么是f1_scorehttps://blog.csdn.net/qq_14997473/article/details/82684300主成分分析(PCA)原理详解https://zhuanlan.zhihu.com/p/37777074卡方检验(Chi-Squared Test)https://zhuanlan.zhihu.com/p/56423752。

2023-08-18 01:18:47 84

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除