机器学习建模比赛
qq_47506661
这个作者很懒,什么都没留下…
展开
-
2020-09-27
task --模型融合 import pandas as pd import numpy as np from sklearn.ensemble import RandomForestClassifier from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn import metrics from sklearn.metric原创 2020-09-27 23:55:53 · 219 阅读 · 0 评论 -
金融风控-贷款违约预测 -- task04
金融风控-贷款违约预测 – 建模调参 今天有点挫败感,遇到了个bug,暂时没有搞定。 大家都run的baseline,我一个人按照自己的理解做题,不知是好是坏,感觉不在一个频道上,不过,我这种自己做的,估计对整个流程的理解估计会比他们深吧。 今天只跑了一个模型,低估了模型计算的计算量,另外,发现了另外一个不好的点,使用pycharm,每次都需要重新运行,很浪费时间。 今天先贴下今天的战果吧,后面有结果再补充,组队学习完成了,但是学习还是没有完成的。 本来计算用下面几个模型run的,但是今天只完成了随机森林。原创 2020-09-24 23:33:53 · 150 阅读 · 0 评论 -
金融风控-贷款违约预测 -- task03
金融风控-贷款违约预测 – task03 特征工程方法总结如下: 1)数据分箱 2)对数变换,使变量更加服从正太分布 3)onehot或者lablecoder 重编码变量 4)特征组合 现在了解还比较前,以后可以把各项内容再细化研究 本次特征处理方式如下: n0-n14,与应变量的关系暂时没有深入研究。 暂时打算做标准化处理。后面研究下别人的内容再进一步处理。 希望明天的模型能有个好结果。 ...原创 2020-09-21 23:36:17 · 147 阅读 · 0 评论