自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 2017.06.30回顾

1、工程上一些修改事物2、增加变量3、更多变量要求

2017-06-30 17:05:51 206

原创 2017.06.29回顾

中途出门休假几天,实际上还挺累的,不擦防晒霜还会被晒黑,每天要走很多路,昨天回来上班第一天,下面进行一下回顾1、一系列de改进实现工作2、平台一些问题反应3、开会,接近2小时,文档整理4、继续建立新模型,新增自变量,尝试了一些新逾期定义,某些变量存在波动

2017-06-30 09:40:05 194

原创 2017.06.21回顾

1、写了回顾,然后就是检查装饰器的写法,当然我也需要去学习装饰器的写法,其实最简单的理解就是函数某些代码抽象重用,装饰器就是带入被装饰函数,可以装饰多层,但高级的用法,我还需要去熟悉一下2、下午各种工程问题,然后思考了下打合作方脸的方法,各种杂事

2017-06-22 10:13:01 166

原创 2017.06.20回顾

1、上午主要就是写欠的回顾,开小会汇报工作2、完成了合作银行不SA相关问题3、橘子4、下午主要是完成了r3c的逻辑,有些小细节有些麻烦,没什么新东西5、又是开会6、直方图绘制的问题python直方图绘制,主要就是用到matplotlib这个强大的模块,下了个demo,具体的还需要研究由于python相对要复杂一些,开始研究excel,我现在找到的方法excel并没有

2017-06-20 18:28:25 267

原创 2017.06.19回顾

1、在网时长数据相关处理2、继续解决京东问题,写文档,重跑数据,调整cutoff3、纠正同事一些错误4、处理服务器相关问题5、MYSQL的date_format(date,'%Y-%m-%d'),oracle是to_date('2017-06-19','yyyy-mm-dd')6、present value真实含义?这个问题未解决目前睡觉引入了打卡监督机制,效果不错,继续坚

2017-06-20 10:55:33 215

原创 2017.06.15-2016.06.18回顾 loc/iloc/ix dataframe相关 oracle无自增去重 correl

上周最后阶段比较忙,主要是忙jd的数据测试的事情还有就是各种新产品的事情,下面回顾一下这段时间的工作。1、上周四快下班的时候开了一个新产品的会,初步确定了风控策略,但是接近下班的时候又告诉我另外一个新产品需要紧急上线,同时jd的数据到了,草草看了下就下班了2、pandas中loc/iloc/ix区别,loc按行名列名索引,iloc按下标索引(可以切片),ix可以混合前面两种索引方式,df不

2017-06-20 10:37:46 429

原创 2017.06.14回顾 dtype相关 Series平均数 type_of_target

1、Series计算平均数,df[column].mean()2、上午给同事讲了很久的关于验证四变量模型少掉两个变量仍具备有效性的证明,这个过程中也被多次打断3、讲完开始写昨日总结4、ndarray只能有一种数据类型,就是其中每个元素的类型,不能说每一列一个类型5、np.sctypeDict可以查dtype类型dict,有很多不同的表达方法,其实是说的一个类,np.str_和np.

2017-06-15 11:15:14 1068

原创 2017.06.13回顾 series筛选赋值不是deepcopy?

1、在网时长的逻辑重新修正2、桔子的事情已经是停止了3、非银联合作银行的事情开发了一半,被打断4、拒绝疑似欺诈业务员5、开会6、面试7、晚上继续开发那一套python标准评分卡工具箱,就是解决那两个bug,解决了我一晚上series的筛选赋值,是赋值到copy上,但是实际上却赋值成功,昨天和洋神讨论的是这个机制是copy,不保险,并不是deepcopy。另外一个bug是,我

2017-06-14 11:41:00 619

原创 2017.06.13回顾 series筛选

1、上午涉及到几天的小结,所以差不多用了一个上午的时间,小结中确定了早睡的督促办法2、做员工贷的逻辑,没什么新东西,写了新的逻辑3、尝试了7C的最大授信逻辑,但是有一些问题,搁置了4、然后就是同盾的在网时长改版的问题5、晚上主要是做标准评分卡的工具包,主要解决几个问题,一个是离散化的问题,离散化只能按照去重后的value个数来,还有就是没写group数量太小,结果不稳定的问题,类似

2017-06-13 10:31:38 2879

原创 2017.06.08-2017.06.11回顾 欺诈事件 SQL不足

上周四、五主要时间都是在处理一个反欺诈的事件,故事大致是这样的,一线的反欺诈同事发现了近期很多通过的客户具有同一种pattern,就是单位类型是党政机关,所处行业却是制造业,后来反查发现这种不自洽客户的通过率高达90%,然后就就去排查每一个信用模型变量,并且尝试各种新的变量,看从什么角度能停下这种pattern的人,最后用了两天的时间,却发现无懈可击这种人,他妈的,最后才发现这是IT的BUG,他妈

2017-06-12 11:34:47 347

原创 2017.06.07回顾 requests

1、上午写小结写了大概一个多小时吧,然后调整了一些地区规则2、调查了老客户的一些拒绝原因3、review了前海常贷客数据,发现产品本身,和数据仓库的一些问题,还需要进一步弄明白4、快下班的时候开始学习requests模块的用法,然后尝试retry,retry这一块我找了很多资料,未找到解决方案,果然一google就出来了,方法类似于urllib2,retry配置是建一个sessions

2017-06-07 20:55:21 212

原创 2017.06.06回顾 三种构造dataframe的方法 多重共线性开坑

1、和星期一上午一样的问题,就是精神不好,打瞌睡,我后面的主要工作就是把注册信息变量提取整理做到建模表中,上午还日常看了下股票,亏得他妈一塌糊涂2、下午一来就是继续v7的开发,关于上一个工作日的两个list合成dataframe的方法,我觉得是存在问题,感觉到太繁琐了,我于是查了下资料,我震惊了,原来那么简单,我并且根据这个总结了三种不同的构造dataframe的方法#三种构造datafr

2017-06-07 10:43:59 2139

原创 2017.06.05回顾 dataframe找到喊缺失值的column list组成dataframe

上午精神不是很好,有点瞌睡,看了下周边,群里面水了几句1、思考了下模型评价的问题2、决策引擎修改3、继续建v7,首先建了个轮子,找出dataframe中的缺失值,用isnull写一个函数,我开始也大概想到这种思路的,但是还是在不遗余力地寻找现成的方法def find_na_column(df): miss_columns = [] for column in df:

2017-06-06 10:15:53 1279

原创 2017.06.02回顾 模型评价的正确方法

1、决策引擎调整2、做了现在模型和上版模型的比较,令人意外的是上版模型在目前的放款客户中有非常好的rank order,这就尴尬了,那毕竟是我抠脚建的模型,居然在现有模型的通过域中有这么好的划分,但是问题来了,我感觉到,如果把此模型用于全部样本,可能区隔并没有这么好,因为这个模型当初12月、1月也使用过并没有逆天的效果,略微好于现在,难道要把这两个模型ensemble起来?直接ensemble

2017-06-05 15:01:11 401

原创 2017.06.01回顾

1、上午本来是想写模型评测报告的,但是精神不是太好,我就去看了一下前海风险度的接口文档,然后自己研究了下库表,询问其他开发人员,搞清楚了逻辑,创建了几个变量,还有些时间在和老大沟通需求2、下午继续搞评测报告的事情,我看了下其他公司的报告,水平也就一般,然后自己写了一个简介明了的版本,稍微控制了一下格式就发出去了3、然后修改测试接口4、找一些文档资料发给同事5、开始找以前v5的逻

2017-06-01 17:33:03 214

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除