自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

jin_tmac's studio

Just do it

  • 博客(3)
  • 收藏
  • 关注

原创 feature_importances_ - 从决策树到gbdt

在用sklearn的时候经常用到feature_importances_ 来做特征筛选,那这么属性到底是啥呢。分析gbdt的源码发现来源于每个base_estimator的决策树的feature_importances_由此发现计算逻辑来源于cython文件,这个文件可以在其github上查看源代码而在DecisionTreeRegressor和DecisionTreeClass...

2019-02-26 17:47:13 21220 4

原创 模型监控中的应用--Excel动态图表和VBA

在监控模型变量的有效性和稳定性时需要看woe变化以及iv变化,可以做成下面的动态图表,可以同时选择变量以及监控的指标。方法如下:准备数据:然后,插入数据透视表,行添加为‘state_date’,列添加为‘var_clus’,考察指标设置为求和项,注意:var_name此时不添加,对透视表添加‘切片器’,将var_name勾选。最后,对透视表插入折线图,并在当前sheet添加如下宏代码。...

2019-02-19 14:29:57 1417

原创 特征筛选(变量聚类proc varclus)

在模型筛选变量的时候,我们可以用varclus进行变量聚类分析来进行降维。提到降维我们会首先想到主成分分析,主成分实际上是正交主成分。而varclus是斜交主成分,其是在正交主成分的基础上再做了一些旋转。这样得到的主成分不仅能保留主成分的优点(主成分变量相关程度比较低)。另外一方面又能有很到的解释性,并且能达到对变量聚类的效果。综合说来就是,主成分分析是生成了新的主成分变量,用原始变量的线性关系...

2019-02-18 18:53:19 10884 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除