- 博客(2)
- 收藏
- 关注
原创 train_test_split、cross_val_score与GridSearchCV的区别、联系与应用
今天在优化模型的时候碰到了一件头疼的事:train_test_split、cross_val_score与GridSearchCV貌似是三个非常相近的概念,它们都包含交叉验证的相关知识。在我查询的相关案例中三者也都有相应的出现,但比较杂乱,此处对此尽量做出一个我个人的理解和思考。
2023-08-16 17:01:58 283
原创 用户新增预测挑战赛:关于baseline的解读和看法
赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common_ts为应用访问记录发生时间(毫秒时间戳),其余字段x1至x8为用户相关的属性,为匿名处理字段。target字段为预测目标,即是否为新增用户。
2023-08-15 13:01:36 158 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人