自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 量化还是风控?

量化投资的东西也看了一两天了,怎么样?可以解答你第三个问题了吗?总的说来,量化投资,应该我自己的那种尝试,不能叫做尝试,我只是用了一个类似于小市值的策略,然后简单止盈,发现回测效果后,就用来实盘,只能说回测不是那么值得信赖,回测代表不了模型未来的表现,我想同理,回测很难也代表不了未来不能赚钱,所以回测就感觉跟没用似的,所以以我粗浅的这种经历来看,我无法回答量化到底靠谱不靠谱的问题?然后我就去搜

2017-03-31 18:40:38 4145 3

原创 2017.03.29回顾

昨天战斗力几乎为0,中午吃了那个感冒药,实在是太困了,下午看了下知乎上的量化问题,关于量化这个领域前景的,看完了我也没得出量化到底靠谱不靠谱的结论,反正就是值得怀疑的一个领域,需要进一步调查。上午做了一些小的修改吧!感觉他妈的也没干什么啊?操!时间都被浪费了吗?思考的内容在备忘录里写下来,决定果断点儿!

2017-03-30 10:28:04 193

原创 2017.03.28回顾

上线了测试环境接口,上线了24期、36期产品以及相关逻辑,没什么新东西,多传一个变量进去判断是否是白名单区域。看了下关于现金贷几个公式的文章,自己用那几个公式算了算,算了下目前敝司的一个cpf。了解了下国内的量化领域,感觉和我目前的风控建模待遇差不多,甚至风控建模的需求更多,按理说,量化逼格更高,技术难度更大,但是实际上看起来并没有体现在招聘网站的薪酬上。搜了下蚂蚁金服,总结起来就是市

2017-03-29 11:13:06 278

原创 2017.03.27回顾

总的说来,还是个节奏的问题,节奏有点儿乱,悬崖勒马,算法的研究准备已经告一段落,现在最重要的是对几个重要的问题的思考,如果FM那边通过的话,也会面临重大抉择问题,然而这个抉择又是跟我之后的追求息息相关,所以这两天就一定要思考出来,到底何去何从?这个是第一优先级的,这两天晚上多在公司呆一下思考思考。不要看nga了,干货更新速度几天甚至一周才会出现,其他都是没什么意义的闲聊,不要去和那些人浪费时间

2017-03-28 10:19:39 176

原创 2017.03.24回顾 归一化 标准化 R2 date_format 共线性 系数检验 决策树

1、as cash,调整了某两类的客户的审批阈值2、归一化是线性映射到0-1,z-score标准化是(x-μ)/δ,经过转换后均值为0,标准差为1,机器学习实战那本书讲岭回归的时候,标准化的方法是除以方差,这样一来标准化后的标准差就是1/δ3、线性回归评价指标R2,是回归值平方和除以真实值平方和4、mysql中datetime截取年月日有一个内置函数,data_format(datet

2017-03-27 14:40:22 1392

原创 2017.03.23回顾

1、上午补充了一些基本的线性代数知识初等变换:矩阵一行乘以一个数                   矩阵一行乘以一个数加到另外一行                   对调两行说X可逆,是对方阵而言,对于行列不等的一般矩阵叫的是左右可逆X是m*n的矩阵,且m R(x) = R(xT) = R(xTx) = R(xxT)行列式是方阵,行数等于列数机器学习实战那本书上

2017-03-27 10:55:44 347

原创 2017.03.22回顾

1、修复了一个机制上的不合理的地方,由上次贷款额变为上次授信额2、上午面试了2个人,浪费了很多时间,面试完差不多就吃中午饭,要说获得的东西,比较少,CART树我之前只是用来做回归树,做分类树的时候我还没有实践过,我还差点忘记可以做分类树,另外一个人写的SQL,order by后面跟having,差点还把我麻过去了,having只能跟在group by后面,写分组条件,还有什么东西?好像没有什么

2017-03-23 13:55:36 208

原创 2017.03.21回顾 WHERE GROUP BY 和 GROUP BY HAVING None numpy矩阵相关 matplotlib.pyplot画图

1、昨天模型主要做了几个改动,添加了一种机制去限制快速还款的老客户的下次贷款金额,修改了老客户进入通过域,随机通过和拒绝比例,在这修改的过程中是否遇到什么技术难题?没什么新问题,只是上线前测试是非常必要的!好几个问题都是测试中发现的!2、我之前有个SQL误区,我认为group by了条件语句只能在后面having去引导,但是实践中我发现,where语句后是可以跟group by语句的,grou

2017-03-22 16:47:40 531

原创 2017.03.20回顾 霸气

1、仔细看了矩阵求导的公式,推出了最小二乘的参数表达式,但是矩阵求导公式本身,我尝试推导了一下,发现没对头,矩阵求导的关键就是对其中每一个元素分别求导,然后照着《机器学习实战》写了最小二乘法的代码2、和群内的伙伴交流了下,也说到了是否有意去外地,这成了我最近亟待考虑的问题3、其中提到exprian的决策引擎,感觉灵活性比较低,我查了下基本上都是官网的文字介绍,实在难以琢磨出其具体的形式

2017-03-21 10:22:57 238

原创 2017.03.17回顾 IV系数理解

1、上周五上午吃了药,实在是困,上午半睡半醒间还去面试了一个人2、下午巩固了一下iv和woe,我居然记不住怎么通过woe计算iv,记不住前面乘以一个什么系数了,我重新审视了一遍这个系数的意义,我觉得有三个作用,第一、这个系数带了该类样本占总样本的比例信息,第二、这个值(Gi/GT) - (Bi/BT)的正负和后面的ln((Gi/GT)/(Bi/BT))相同,消除正负号,便于后面累加,第三、这个

2017-03-20 10:08:02 579

原创 2017.03.16回顾 线性代数 最小二乘 pdo 3C

1、研究了线性模型,写出损失函数,然后求导就给自己卡了一下午,我不知道矩阵该怎么求导,方法就是所谓的最小二乘,在解决这个问题的过程中,我也温故了一下数学知识。向量内积:又称向量点积(dot product),两个向量相乘得到一个标量,在二维和三维空间的几何意义是,两个向量模长乘以夹角的余弦,ab = ︱a︱︱b︱cosθ 向量外积:又称向量叉积,两个向量相乘得到一个向量,向量的模等于︱

2017-03-17 17:58:59 365

原创 2017.03.15回顾

1、主要研究了那些很快结清贷款,再来贷款的风险问题,案例太少,但是多数都还得非常好,还得不好的也并非欺诈,是信用风险,主要涉及到一些比较复杂的SQL编写,唯一走了下弯路的应该,group by account_id HAVING product_no IN ('1A','2A') and count(*) >=2 ,这个时候的count(*)包含了非1A/2A的产品,所以应该在外一层层级使用gro

2017-03-16 11:03:35 256

原创 2017.03.14回顾

1、询问了下我们的流程是否有做手机实名认证,并没有专门的手机实名认证,LP靠支付宝核对,但是只是作为贷款的辅助2、帮knowru解决问题,做了一个实验,咨询了nginx的并发和排队机制,队列容量,大于队列容量丢弃,但是他问题还是没解决3、给同事讲解了下审批流程4、代码继续做了一点儿优化

2017-03-15 10:26:02 229

原创 2017.03.13回顾

星期天晚上喝了酒,没有休息好,导致昨天状态非常差,下次打死老子,老子都不会去了1、主要处理了下knowru的一些性能问题,30s的问题进行了沟通2、做了一些性能上的小的修改3、继续研究GBDT如何结合LR,选出重要的组合指标,我研究的是通过牛顿迭代法计算的node value和本身的0、1分布是否有某种相关性,依靠的是实验的方式回去的时候比较晚,玩了会儿wow,下线了就应该速度睡觉

2017-03-14 18:23:08 214

原创 2017.03.10回顾

星期五比较忙,主要忙系统错误的事情1、上午复习了下ROC曲线的绘制,这个真的是非常容易混淆,一不使用,一会就记混淆了2、复习了一下pearson相关系数,几何意义是,两个向量夹角的余弦,这两个向量是,每个分量与均值的差值构成,相当于是一种中心化3、下午去面试了一个人,这种交流对大家都是一种提高,只是不太合适4、下午还有很多时间在处理knowru的问题,我自己也对代码做了修改,实践证

2017-03-13 10:52:49 592

原创 2017.03.09回顾

1、昨天周四,一早就去把户口的事情办了,办户口的时候有个小插曲,就是旧的户口页被警察收了,我女的不开心,我后来想了下,我还是应该去争取一下,虽说是警察也不应该怂,而且户籍警察不虚火!因为不是我的东西,在我这里被收的,我还是应该维护一下的!其实倒是没什么用了!2、来到单位已经10点过了,上午就写了下总结,心里还在想办户口的事情3、下午处理了工作中的问题,一个是和同事对接怎么存储我的数据,第二

2017-03-10 17:58:26 208

原创 2016.03.08回顾

1、我把对应的两张表的数据封装成了json返给审批系统,有个新的东西就是,如何把两个list,直接转成dict,dict(zip(listA,listB)),其他好像没什么新东西了吧?2、上午继续研究了gbdt树的权重问题,写在了昨天的回顾中3、昨天晚上回去肚子不舒服,还是玩了会wow,就不应该吃辣的,零食也少吃!按时睡觉还将就吧!继续警戒自己,按时睡觉,少吃零食脂肪!

2017-03-09 14:05:10 140

原创 2017.03.07回顾 GBDT前面树权重更大 python散点图

1、确定数据传输格式2、看了下通过率方面的问题3、下午开始研究GBDT相关问题,我最开始的疑问,是不是前面的树的权重大,对于我实际的数据集大多数样本点是这样的,少部分比较反常,但是我后来换了一个标准数据集,由于数据集太好了,损失函数直接就收敛到0了,所以每个点的预测值也是收敛到一个非常大非常小的值,在expit函数下,大概绝对值8,数值就很接近1或0了,然后前面收敛曲线基本上接近于一条直线

2017-03-08 15:03:26 1267

原创 2017.03.06回顾

1、下午听了博士关于fraud的相关工作介绍,看了下代码的大致结构,然后查了下大概多少人是刚放款客户重跑模型,想了下人事的应对2、上午主要也是联系另外一边的人事,同时也开了个小会3、昨天晚上不该WOW的,干什么都好,不要说什么上去看一下,而且应该干的一小时运动并没有干(当然也有情绪因素),最后也并没按时睡觉,咳嗽的问题也要引起重视了,差不多一个月了!11点半之前一定上床睡觉,11点就开始准

2017-03-07 10:43:45 210

原创 2017.03.03回顾

1、关于python中是引用传递还是值传递,对于类实例来说,都是引用传递,但是对象分为可变对象,和不可变对象,不可变对象就是用的值传递,可变对象用的是引用传递,参考http://blog.csdn.net/vernice/article/details/508320692、星期五一直思绪也比较混乱,头脑里老是闪现出一些离开这个城市的想法,去找这个国度最牛批的人为伍的想法3、下午主要就是和韩

2017-03-06 10:12:25 205

原创 2017.03.01回顾

1、把合作方的信用分数计算单独做成了接口2、试图弄懂gbdt论文中line search等步骤,但是最后博士给我讲解了下,我还是没弄懂,只是大概搜了下,普通的情况一般是参数空间的梯度方向,最速下降,这个函数空间的我真是有点方3、然后跑模型提前,配合IT准备了一下4、回到家,主要就是看一些业务知识,还是挺有帮助,准备了一下面试,其实说白了也算是一种交流沟通,对行业的了解,也是一种学习!

2017-03-03 16:38:03 171

原创 2017.02.28回顾 gbdt预测值更新 np数组取反

1、对决策引擎做了一些审批阈值的调整2、继续对GBDT进行研究,研究了预测值如何更新的问题,我当初简单以为是用叶子节点的样本平均值表示预测值,昨天仔细跟了代码,才知道是用叶子节点样本的残差和除以一个以残差、y为输入的式子,sum(residual)/sum((y-residual)*(1-y+residual))这个就是所谓的牛顿迭代法求解,这个值的数量级整体趋势为什么会越来越小?(这个是我问

2017-03-01 10:47:32 859

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除