写在前面:差一点就放弃了!其实项目进行到T4,从内容上还是很好理解了。前面的Task相当于是准备工作,包括数据EDA、特征工程都是未来建模做的准备,当我们把数据分析好以后,接下来自然就是建模啦。所以T4主要讲的就是建模和调参。我觉得教程中使用的数据应该和我们下载的数据结构是不一样的,所以在程序的开始就把我难住了。我读取的数据根本无法按照教程代码去运行。对于Python基础巨差的我真是无能为力,我差点就准备放弃,坐等被抱出群聊时,已经被挠秃的榆木脑袋突然就灵光了,试着改了改代码,居然成功了(虽然是很简单的代码)。下面我也会放出我写的代码的。
依然附上整个项目链接:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl
************************************************我是分界**************************************************************************************
Task4:建模和调参
1、读取数据:
正常的读取数据流程是读取一个模型数据,然后对数据进行建模处理——即分离数据集,分成训练集和测试集;目的是为了利用交叉验证对模型性能进行评估。教程就是采用的这个正常的流程。
但是,我们下载的数是已经分好的train和testA&#x