- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 分箱(binning)
一.定义分箱就是将连续变量离散化二.好处储存空间小 将所有变量变换到相似的尺度上 对异常数据有很强的鲁棒性 引入了非线性 使模型会更稳定,降低了模型过拟合的风险,提升模型表达能力,加大拟合三.方法关于变量分箱主要分为两大类:有监督型和无监督型A. 无监督:(1) 等宽 (2) 等频 (3) 聚类#coding:utf-8from sklearn.clust...
2019-03-02 17:16:53
6769
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人