1、上午对现有决策引擎做了一些简单修改,没什么技术含量,注意的地方就是条件概率的计算
2、继续SQL抓取数据集,没什么技术含量,后来发现中间少抓了几个变量,已经补上,后面还需要check看是否遗漏变量
3、有了数据集,又开始耍自己的评分卡工具包,对工具包做了一些修改,美化barplot/修正排序BUG/regroup写成静态方法,过程中发现一些问题,也有一些收获
- 我发现我给int64的series赋值了一些str,这个时候部分变成了str,部分还是long,dtype显示的是object
- 我开始尝试用astype去改变整个series的类型,结果发现失败,后来才想起astype只是返回一个copy,又不会影响原始的series,查文档发现astype有一个copy参数,默认是True,如果改为False是不返回copy直接影响series呢?还是直接就不返回copy什么都不干?这一点需要尝试,我目前是直接把astype赋值回原来的series
- 写了个函数解决形如'xxx-yyy'和’-1‘共同存在时的排序逻辑,前面主要就是负数的影响,这个时候仍然可以按'-'做split,'-1'.split('-')是含有两个元素的tuple,('','1'),如果第一个元素是'',那就用整个-1做排序,如果前面不是'',就拿xxx做排序,这个方法完美解决。
- sorted以前惯用的写法是sorted(dict.items(),key=lambda item:item[0])