- 博客(1)
- 收藏
- 关注
原创 数据预处理
用Cut函数分箱 有时把数值聚集在一起更有意义。例如,如果我们要为交通状况(路上的汽车数量)根据时间(分钟数据)建模。具体的分钟可能不重要,而时段如“上午”“下午”“傍晚”“夜间”“深夜”更有利于预测。如此建模更直观,也能避免过度拟合。 这里我们定义一个简单的、可复用的函数,轻松为任意变量分箱。 def binning(col, cut_points, labels=None):
2016-07-27 22:52:54 985
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人