- 博客(2)
- 问答 (1)
- 收藏
- 关注
原创 python的等深分箱
背景当前很多文章尝试过最优分箱,python上也有cut等方法进行等宽分箱。为了方便日后输出结果以及分箱要求。做一个简单的轮子以供大家日后使用。很多能用其他轮子的地方也没有多余出力,也不托大会比别人写的好。空间复杂度尽我所能。方法展示话不多说上代码。以下为等深分箱以及encoding方法# -*- coding: utf-8 -*-"""Created on Tue Ja...
2019-01-30 17:39:08
7901
原创 变量衍生方式初探一之数据清洗自动化
最近准备开始韬光养晦,磨砺一下自己的基础知识了。也同大家一起提升自己,文章内容多是自己见解,有可以指点探讨得可以及时指出。 变量衍生的这个课题其实比较庞大,算法结果的好坏90%以上是来自于数据。首先会有一些常规的数据清洗的工作要做,而数据清洗的时间又占用了整个项目的80%,那么我们从这里开始。数据清洗 代码脚本基于python3实现,个人最近由r转向python,老实...
2018-07-18 11:06:28
5106
空空如也
r语言正则匹配,如何选取中括号中的内容
2017-09-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人