1、完成前一天没有写完的回顾,然后相关知识点进行了实践和搜索学习
2、和同事讨论,psi和woe变化的研究,进展还可以,我需要去check思考一下,最后精准量化结论
3、fork了一个脚本,发现kaggle跑和本地跑结果有差异,不知道是什么情况
4、lightGBM参数学习,lightGBM直接支持哑变量似的分隔操作,没有dummy编码,但是在分裂的时候,会考虑1个类和其他类这种分化,主要好处是节约了内存空间,发现要理解这些算法的机制,必须要有深厚的数据结构与算法功底,这门课太重要了
5、一些杂事,回顾了下re,好久没用