自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 2016.08.30回顾

1、上调老客户贷款金额随机上浮概率和比例2、其他时间就是看一些股票的入门知识了,股票也算门技术,还是总结一下吧了解了k线图怎么看?k线图本身形状有点像统计中的箱线图,以日k线为例,分阳线、阴线,阳线红色代表涨,阴线绿色代表跌,阳线矩形上端收盘价,下端开盘价,伸出去的线顶端最高价,伸出去的线底端最低价,阴线矩形上端开盘价,下端收盘价,对于伸出去的线和阳线相同一般和k线一起的还有一个均线,

2016-08-31 15:51:54 344

原创 centos开机自启动 2016.08.29回顾

昨天主要是研究了下量化和股票的一些基本概念以及操作等1、主要是研究了一下优矿这个玩量化的站点,这个站点封装了很多,要写策略直接在web端的notebook上就可以直接写,数据也有api可以很方便的调用。还有一个python量化分析师日志的帖子,里面涉及到的金融衍生品太专业,不是很懂,我决定从股票着手,下了雪球,申请了开户,了解了下股票相关的基础知识2、centos开机自启动,参考cento

2016-08-30 09:44:35 295

原创 2016.08.26回顾

1、星期五上午写了一上午的前一天小结,主要那天的工作比较多,所以写起来需要的时间也比较多,这是对的,就是要认真仔细甚至写得让别人容易理解,磨刀不误砍材工!2、中午去选了照片回来就已经是3点了,回来基本上就只干了一个事情,就是对于收入模型进一步研究,尝试了另外几种拍脑壳策略,比较残差平方和(我发现比较残差平方和优于比较残差绝对值和)发现了测试集上比较好的一种策略下午应该还可以更高效一些,认真

2016-08-29 09:52:15 296

原创 xlwt sendmail linux/windows风格回车 crontab 软连接 python时间格式化 2016.08.25回顾

昨天主要就是做keyco的需求,一天之中分三个时间点,自动发送邮件,邮件的附件是excel,所以我首先需要学习一个python中写入excel的模块,我使用的是一个叫xlwt的模块,excel的数据来自于SQL查询,最后取出结果,撰写正确的SQL查询语句,MySQLdb,fetchall()方法取到的是一个二元的tuple,表达了一个二维的结果表,然后将结果集写入excel,再以邮件附件的形式把e

2016-08-26 11:27:35 437

原创 2016.08.24回顾

1、上午对于收入模型进行了一些收尾工作,包括评价指标的讨论,残差平方和,残差绝对值等等,还和拉登吹了下牛2、下午修正了一个系统bug3、还看了下拟合优度有关的问题4、临下班的时候,讨论了下同事的分析,总体说来,有很多漏洞,对方也承认,所以结论是不可靠的

2016-08-25 09:44:51 191

原创 su -c 残差平方和 2016.08.22回顾

昨天的工作主要是v4 model上线,由于欺诈部分没测试,一上线就出了很多问题,下次这种情况,还是要等相关的人员回来再上线,不要急一时,测试要充分,通过检查代码的方法还是容易遗漏bug,还是通过跑程序,充分测试比较靠谱!1、收集了一条linux命令,su username -c "command",切换用户后,执行-c后面的命令2、如果py脚本中有中文注释,则必须声明编码方式,如#codi

2016-08-23 12:09:53 465

原创 工作目录 python格式化字符串 logging不输出 linux其他用户执行权限 2016.08.19回顾

今天的工作主要是测试v4 model,发现了一些小BUG,也验证了一些可以使用的机制,总结如下:1、有一个进程工作目录,和脚本所在目录,脚本所在目录写了一个相对路径,但是跑起来的时候,是进程工作目录下去查找,应该是在manage.py下,这一点我需要进一步研究2、SQL中insert into语句的时候,python格式化字符串,对于python中的数值变量值,格式化替代的时候可以用%s,

2016-08-19 18:00:48 929

原创 select 1,import,insert into 2016.08.18回顾

昨天主要就是完成了v4 model开发的剩余工作,包括接口内部逻辑,黑名单sql封装成函数,调用顺序控制,结果组合,结果写进数据库等等,搭建好了测试环境,从中也学习了一些小技巧1、连了表,select *,1中的*只能放前面,*放后面就只能每个表单独指定,比如table_name.*,而1就是生成一个value为1的字段,未指定字段名,默认和value相同,而不是group by中的1代表第一

2016-08-19 09:44:41 457

原创 web接口排队访问 子查询where条件字段搜索域 2016.08.17回顾

1、昨天尝试想实现一个接口同一时间只能有一个调用,查了点儿资料,开始想的是设置一个全局公有变量,调用开始一个数值,调用结束另一个数值,实际上还是有问题的,因为不是原子级别的,因为有可能两个请求同时发生,都检测都那个变量是可以调用的状态,那么有可能同时就跑起了2个变量,洋神说简单的实现是加锁,python的threading的lock,分布式锁有一个redislock2、但是后来我考虑到将来的业

2016-08-18 18:02:00 544

原创 2016.08.16回顾

昨天仍然是改SQL,SQL金额有问题,我把现在的用最大最小映射方法映射到以前的区间,于此同时发现了以前数值方面的问题,进行了修改和讨论,加入了贷款五级分类的判断逻辑,基本上完成了SQL,还需要代码检查,和黑盒测试!然后view层面完成了model接口的大体逻辑!总体说来效率偏低,做事不够专注,但是也和我有点瞌睡有一定的关系,防止效率偏低就是不要在工作时间开群聊,这是比较有效的办法!如果我因

2016-08-17 09:34:06 264

原创 2016.08.15回顾

昨天主要就只做了一件事情,就是修改v4模型的核心SQL,在这个修改的过程中,是否有一些值得总结的点呢?1、MYSQL模运算MOD2、添加字段,ALTER TABLE table_name ADD column_name column_type DEFAULT NULL

2016-08-16 09:18:55 178

原创 可能MysqlDB的一个BUG产生的warning 2016.08.12回顾

1、上午主要就是讨论确定了方案,讨论可以强势,把握好不吵架就可以了!2、已经完成两个核心SQL,以及pboc解析接口,更改了一些冗余的交互参数等!(但是有一点SQL的问题,我还是没研究出来,为什么用MysqlDB会报一个warning,就因为我多写了一个DROP TABLE IF EXISTS table_name,但是create本身不会帮你drop存在的table,必须自己手动去drop,

2016-08-12 17:42:13 206

原创 2016.08.10回顾

1、帮tony装openvpn,解决wifi连接问题,navicat数据库连接2、查看五级分类的标准,贷款五级分类并没有明确区划,其中逾期天数只是一个维度,一般不按照这个维度来评定,但是有一种能查到的说法是在90天以内逾期被归到关注,但是我看了下数据库的数据这个定义显然不是每个机构都是一样,因为有些0-30逾期,30-60天逾期,甚至超过90+天逾期都会是关注类!3、下午和tony有一些交

2016-08-12 09:36:32 233

原创 防止回车键提交表单

表单应该是自动捕获回车keydown事件,keycode=13,如果多个事件的话,优先级是keydown > keypress > keyup,但是可以禁止form的keydown事件,form中加入属性onkeydown="if(event.keyCode==13)return false;"

2016-08-10 09:59:31 198

原创 centos安装LAMP composer laravel 2016.08.08回顾

1、昨天早上基本就干了一个事情,就是把重新计算loan_amount和重跑模型合并成了一个接口!做了部分测试,SQL返回结果为空,是可以直接做if判断的,印象中只有一次没成功,原因不明,等下次能复现再说!另外一点就是不用跑一句SQL,关闭重建游标,一个游标可以一直用!2、下午主要的工作的就是在内网centos服务器上部署php的laravel环境,花了整个下午的时间还没弄好,但是部署的事情还是

2016-08-09 14:14:08 613

原创 2016.08.05回顾

1、最主要的是抓数据,估算了combine模型对于approve rate和LP rate的影响2、上午是完善了风控监控平台,做好了导航和另外两个页面,基本上算是把以前的白板移植到了adminLTE这个框架内还是要规划好,及时写总结,不然时间一过就忘记了!

2016-08-08 09:35:17 224

原创 R语言GLM包相关问题 PHP数组定义及比较 git pull 2016.08.04回顾

1、上午排查了风控系统的问题,重新计算金额和重跑模型需要整合!前端已经限制多次点击重跑模型按钮!模型的SQL同时跑有可能会出现,找不到某个表的错误,因为调用表的时候,表可能被另外正在跑的SQL给DROP掉了,恰好会出现SQL找不到表错误!搞清楚了调用次序是re_model->lptrigger_fraud->model,传征信的调用顺序是parse->lptrigger_fraud->model。

2016-08-05 10:39:05 1679

原创 laravel MVC初探 2016.08.03回顾

1、R的logistic回归是用的glm函数,广义线性回归,里面对系数有一个统计检验,统计量是Z,我不太清楚具体用到的是什么检验方法,我查了一下,没查到,有时间继续查吧2、研究了laravel,按模块(header、sidebar、footer)写成了模板,然后载入,以前做好的两个核心部分。laravel使用的是MVC模式,app/Http/routes.php是设置路由,可以加载控制器con

2016-08-04 14:35:29 490

原创 相关性 把excel数据导入数据库 2016.08.02回顾

1、开始研究新的外部数据源,前海征信的常贷客数据,花了很多时间进行数据整理,了解数据的含义,最后初步做了两个分析,没有显示出预测能力,主要是这个数据不太精准2、数据整理过程中涉及到一个新的技巧,navicat可以直接导入excel的数据,navicat导入向导直接导入,没有表的话,navicat可以自动建,有一些图形化的操作,可以命名字段名类型等,多的数据也可以分步导入,不会影响,但是应该字段

2016-08-03 10:38:45 583 2

原创 gini系数 lift指标 ROC AIC 2016.08.01回顾

1、上午主要研究了gini系数的算法,关键点就是用梯形面积去近似曲线形成的面积,横轴是按照降序排列或升序排列的人,纵轴是bad rate,把bad rate的坐标的两两连接起来就可以得到若干梯形,计算这些梯形的面积之和,近似等于洛伦茨曲线下面积,升序或是降序确定了,梯形在洛伦茨曲线之上还是之下,但是阴影面积是不变的,阴影面积除以0.5(的面积)就是gini系数,但是tony用的并不是0.5,ton

2016-08-03 10:26:11 3962

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除