- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 Kaggle信贷预测随笔二
继续特征处理环节特征转化有分箱和挖掘交叉变量。有些特征变量和目标变量不是典型线性关系,经过分箱,这些特征变量可以提供更高的信息值。比如月收入额和授信额度等金额特征变量在分箱后与目标变量的互信息得到显著提升;为了提升预测的稳定性,当有些变量值覆盖样本数很少(不足总样本数的5%),也常常将这些变量值与信息增量相邻的变量值一起分箱;图中的工作职位清单中,可以看到HR等职位在样本中的占比很低,如果...
2018-09-02 22:58:00 1507
原创 Kaggle信贷预测随笔
Kaggle的案例大多来源真实数据,非常适合拿来提升打怪经验值。跨国金融信贷公司捷信提供Home Credit Default Risk就很经典,笔者甚是喜欢。Home Credit Default Risk提供了贷款申请表,申请用户在本公司的历史申请表,历史还款记录,和征信机构登记的历史跟踪记录。案例分析过程中遇到不少问题,记录下来抛砖引玉。内容包括,EDA,特征处理,模型选择和调参,分析系...
2018-09-01 00:20:23 2248 1
原创 从管事还是管人聊开
经常听到对事不对人的说法.如果一位严格的技术负责人为了优秀的产品设计,只针对具体技术问题上反复唠叨,最终会沦为技术保姆,陷入无止境的基础技术指导工作中而庸碌无为.要管事,必先管人.从细节的技术问题发现工作态度问题和工作方法问题,进而在思想,态度和认知上挖掘问题根源.(可以借鉴丰田的五个为什么思路).最终会发现,问题根源常常不在工作流程上,而是员工自身认知和公司要求之间的矛盾.这时需要引导员工转变思...
2018-04-16 00:52:21 386
原创 Install shield打包时踩过的坑
Install shield是Visual studio官方指定打包工具,但官方说明文档和网上相关资料太少,打包过程中只能自己摸索。本文记录了项目中踩的坑,希望有所帮助。打包时怎么加入所有相关文件?打包时怎么处理非托管COM组件?如何选择.NetFramework?WIN10+VS2015环境里开发的软件,怎么运行在WIN7环境里?有的DLL在开发环境里运行的很好,为什么在有的电脑上无法正常运行?...
2018-04-02 23:49:36 9844 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人