数据挖掘学习——第二周周报

本周进度:

  1. 参照Datawhale提供的baseline基线方案,代码实现了数据分析阶段内容,并学习涉及到的一些函数的具体用法,如isnull函数的多种应用,但因为还没完成后续建模、训练,以及对过拟合、偏差、方差等评估因素的不熟悉,对数据预处理的多种方法尚且无法分清孰优孰劣。
  2. 参照b站python数据挖掘教程学习了几种不同的画图函数的使用方法。Jupyter画图在画图数量较多时较程序画图确实更为方便。
  3. 特征工程阶段内容进行了理论学习,但还没有开始代码实现,特征工程的学习遇到了许多疑惑的点,特征工程的内容和第二次课的内容也有些相似之处,在异常值处理(分箱法)、特征交互方面都存在些疑惑点尚未解决。

学习心得:

第二周原本计划是国庆假期完成第一次提交,但因为拖延和一些特殊情况(手伤看了几次医生),导致时间安排的不合理,没有及时完成。观摩了其他同学的周报以后,看到大家的提交成绩感到很羞愧的同时,也反思了自己的学习方式有问题。最开始进行学习的时候因为各方各面的只是都是第一次接触,觉得有些无处下手,于是乎就按照baseline方案一步一步地走,但问题在于,五个环节设计到的知识量是很大的,要是想一个环节一个环节完全学明白了再往下走,相比于“整体过一遍,先试着初步实现整个步骤,再退回各个环节逐步细化完善”要低效得多,而且后者还可以根据训练结果来判断前面各个环节的尝试孰优孰劣。其他有很多同学也是学习到特征工程、选择模型的环节,但是已经能做出不错的成绩了。希望在第三周的学习里,怀着第二周都没做出成绩的羞愧...赶上进度。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值