学习题目:
https://tianchi.aliyun.com/competition/entrance/231784/information
数据挖掘-建模调参:
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281897.0.0.502039a9sMPoZZ&postId=95460
首先是整理一些模型原理,可以学习一下
线性回归模型
https://zhuanlan.zhihu.com/p/49480391
决策树模型
https://zhuanlan.zhihu.com/p/65304798
GBDT模型
https://zhuanlan.zhihu.com/p/45145899
XGBoost模型
https://zhuanlan.zhihu.com/p/86816771
LightGBM模型
https://zhuanlan.zhihu.com/p/89360721
推荐教材:
《机器学习》 https://book.douban.com/subject/26708119/
《统计学习方法》 https://book.douban.com/subject/10590856/
《Python大战机器学习》 https://book.douban.com/subject/26987890/
《面向机器学习的特征工程》 https://book.douban.com/subject/26826639/
《数据科学家访谈录》 https://book.douban.com/subject/30129410/
###############
对于长尾分布log变换及还原
data["price"]=np.log1p(data["price"])
data["price"]= np.expm1(data["price"])
贪心算法 https://www.jianshu.com/p/ab89df9759c8
网格调参 https://blog.csdn.net/weixin_43172660/article/details/83032029
贝叶斯调参 https://blog.csdn.net/linxid/article/details/81189154
具体代码见:
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281897.0.0.502039a9sMPoZZ&postId=95460