第一次参加天池比赛,根据网上的baseline,依葫芦画瓢。总结几点经验。
框架套路:
1,数据导入和初步分析
2,数据预处理
3,目标函数定义
4,训练模型建立
5,预测输出结果
总结和经验:
1,依赖包下载安装,建议使用国内源,下载速度快。
pip install --upgrade numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
2,数据归一化和预处理,降低占用内存空间和提升计算效率
3,算法模型可以使用多种,网上有boost也有LightGBM,但最后预测结果效率还是一样,需要了解深层次原理和调参,应该是殊途同归的,看有优化空间没。