- 博客(1)
- 收藏
- 关注
原创 分箱
等频分箱 #按照等频对需要分箱的列进行分箱 model_data["qcut"], updown = pd.qcut(model_data["age"], retbins=True, q=20) """ pd.qcut,基于分位数的分箱函数,本质是将连续型变量离散化 只能够处理一维数据。返回箱子的上限和下限 参数q:要分箱的个数 参数retbins=True来要求同时返回结构为索引为样本索引,元素为分到的箱子的Series 现在返回两个值:每个样本属于哪个箱子,以及所有箱子的上限和下限 """ #在这里
2021-04-05 21:36:18
306
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人