自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 2016.12.29回顾

1、上午和BI进行了沟通,把需求和相关文档整理了发给了他们2、更新了爱尚审批阈值和多头借贷阈值3、上午还讨论了gbdt输出概率的问题,predict_proba这个方法,我当时乍一看以为可以,其实不行,这个概率非常非常之接近?难道是数据集太好了?用一下真实的数据集!4、中午练了会舞,下午那个瞌睡哟,简直了!所以没办法跟别人学,中午还是得休息睡觉,整个下午状态都很差,下午找了一些资料,看

2016-12-30 09:36:03 224

原创 2016.12.28回顾 GBDT初探

昨天基本上一直在研究GBDT,主要是直接使用python的sklearn包中现成的算法,但是我在windows环境下安装这个包出现了一些问题,我最后尝试的是下载anaconda,anaconda我了解了一下是一个用于科学计算的集成开发工具,或者是环境,他已经有了很多科学计算相关的包,他的原理应该是基于virtualenv的,我这个anaconda的环境是python2.7.12,里面集成了spyd

2016-12-29 10:00:38 380

原创 2016.12.27回顾

1、再一次仔细检查了joinquant的策略,发现问题不大,可以实盘了2、还进行了一些了解性阅读,包括新一代的建模方法,这类方法比较知名的公司,具体的boosting框架,集成学习的理论基础等等总的说来,效率还是不够高,没把精力集中到一个点子上!QQ和微信分心!工作必须进行起走,本来就是相通的,不如以前那种节奏,一天对半分,多交流沟通,一样强大,关键是效率,就是干!!!另外晚上要在12

2016-12-28 09:43:18 137

原创 2016.12.26回顾

1、对接knowru接口,给我们的文档反而没写太清楚,倒是网站上面的示例更健全一些,注意的地方就是key要加在请求头中2、查找了一下问题,包括那几个报错的,发现是算话方面的异常,爱尚通过率方面的问题是因为github更新,但是服务器上并未更新3、看了下joinquant,检查回测是否符合真实的历史数据,但是发现了一些出入,买入价比当天的价格区间都要高是什么情况,滑点和手续费有这么多?(需要

2016-12-27 10:29:18 275

原创 2016.12.16回顾

1、修正了三要素验证的bug2、玩了会儿joinquant,对之前的回测进行了一些人工检查3、停牌都不会提前发,否则会造成股市波动,都是前一天晚上或闭市后4、对了一下买入价数据,对不太上,但是偏差并不大,似乎是有默认滑点的影响?另外,wow目前占用时间过多,除了低保和raid就不要上线浪费时间了,事在人为,这个舞有可能是一箭双雕的,比如有年会之类的,最后一个周了,认真筹备,

2016-12-19 10:08:16 200

原创 2016.12.15回顾 mysql截取字符串

1、更新了自动邮件增加字段逻辑,给AS和TS增加了三要素验证2、SQL截取字符串后两位,right(field_name,2),取前两位是left(field_name,2),还有个以前用到的截取字符串方法,substr(field_name,7,8)3、去joinquant,又跑了几种能想到的策略,只能说有时候想法很好,但是实际效果还不一定有那种不那么make sence的效果好,下一步

2016-12-16 10:05:25 529

原创 2016.12.14回顾

1、添加了地域白名单,修改了loan_amount以及approve和LP比例,黑名单修改为bli,全部采用national_id去检索2、其余时间在通知吃饭,联系伴郎,看了下sugar,sugar感觉略微有点难度啊

2016-12-15 10:01:06 202

原创 2016.12.13回顾 navicat导入 excel把X小时YY分钟转换成ZZ分钟

1、上午部署好了黑灰名单2、下午给同事讲解表结构和白名单开发3、白名单开发第一个问题是把1小时XX分转换成分钟数,我第一个想法是用正则表达式,但是要导入导出,其实有点麻烦,我寻找原生的excel方法,还是可以的,具体的例子,我另一位同事已经做了,我直接拿来主义了,所用到的函数,我目前还没得及学习4、另外一点在用navicat图形化界面导入excel的时候,有个比例的选项,实际上是sca

2016-12-14 09:47:11 774

原创 2016.12.12回顾

1、昨天的工作就比较单一一些了,上午就是考试,没什么好说的,都是简单SQL,加透视表解决,其实话说回来,SQL本身就是这样啊,就是一些简单的查询插入,我觉得像以前lli和现在我的一些写法是几乎把一个弱势职业发挥到了极致的写法,但是昨天的题目中不能体现出来这一点!2、然后我花了一个下午的时间来做黑名单和灰名单的相关内容,目前的核心SQL越来越庞大了,可能后期会面临一些重构方面的问题,这都是后话了

2016-12-13 11:26:41 326

原创 2016.12.09回顾 dataframe获取某一个值的索引

1、我上午玩了会儿joinquant,按照自己的算法实现一些卖点,进行回测比较2、改良了一个风控系统方面的功能3、要记录股票的市值排名,学习了一下pandas.dataframe的用法,我要在dataframe中取出索引,最后是把dataframe的某一列拿出来,也就是说是一个series,然后用list()或者tolist()方法把series转换成list,然后对于list中没有重复的

2016-12-13 10:51:58 16629

原创 2016.12.08回顾 SQL模块化与子查询 SELECT NULL变换 JOINQUANT探索

1、昨天基本上全天都在弄同盾多头借贷和同盾严重逾期的规则,我想一下学到了哪些东西呢?     - 可以join表,拿相关的字段,也可以直接写子查询根绝关键字段比如customer_id去拿,如果查询比较复杂,后者方法更佳,这样sql显得更模块化,不然这部分sql就是写在from后面     - where后的条件不满足,查出来是NULL,如果对NULL进行条件处理,如CASE WHEN,C

2016-12-09 10:35:47 492

原创 2016.12.07回顾

1、昨天修正了不能approve的bug,然后上午做了一些监控和统计,对于新模型的表现,还有就是快速地抓取数据看了下,lp和approve效果对比2、规费是交易所收的手续费,已经涵盖在了佣金中3、后面的时间写了下基本的SQL,大多数时间在看joinquant的策略,剔除了ST股,效果还是尚可,对于仓位中股票支数不用强迫症,资金分配,用现金还是总市值,总市值更平衡,但是回测的效果,两种比较接

2016-12-08 14:13:02 198

原创 2016.12.06回顾

1、上午基本是看了下joinquant,看一些API,然后做数据比较,看是否有数据存在错误,观察调仓和持仓情况,发现不能保持仓位股票个数,如果考虑到停牌和涨停的情况,预留更多的股票进入buylist,这样在卖出条件的时候存在一定的不公平,比如top1在下一个调仓周期掉出top20的可能性本身就比,top19掉出前20的可能性小,但是即使那个策略如此粗糙,但是他的收益就是高,搞不好我按照我的想法来写

2016-12-07 10:34:10 177

原创 2016.12.05回顾 logistic自变量是分类变量

1、又看了下joinquant,按财务指标选股的时候不加filler似乎可以挑选出全部A股的股,但是奇怪的是有个停牌(或者说已经退市的)出现在了名单之中(300372欣泰电气),是12月2号的数据,然后看了下小市值策略的代码,有两个做记录的成员变量,我不太清楚其意义何在?然后回测的持仓数据来看,可能存在一定的幸存者偏差,几乎之前的全是st股,然后我又用他所谓的40000%的去除st,去除停牌那个策

2016-12-06 13:55:16 2303

原创 2016.12.02回顾 logistic问题 lift curve绘制 excel分位数 excel指数

1、上周五我想的第一个问题是分类变量不通过woe编码,直接数字编码来拟合logistic,但是怎么来确定这个数字呢?比如一个三类变量,可以是1、2、3,也可以是1、20000、30000,我搜了下没有找到解答,我没有想到这个问题的解答,我记得以前二分类变量直接是编码成1和0进行logistic回归2、excel求分位数,percentile(A,B),A参数是范围,B是多少分位3、exce

2016-12-05 10:25:59 1467

原创 2016.12.01回顾

1、上午我发了一些邀请并且寒暄了几句2、尝试用joinquant,做小市值策略,发现找到的小市值股和uqer的有出入,我可能还需要研究下,这种差别是怎么产生的,另外觉得joinquant似乎是要好一些,回测速度也更快一些!3、所谓头寸就是资产,持有的股票市值和现金,而新三板指的是4多少开头的股,主要是一些高科技公司的融资渠道4、在旧数据库中抓取了收入方式数据,观察了三个分数的分布,然而

2016-12-02 09:46:07 173

原创 2016.11.30回顾

1、 把qh分数加进去做分析,要下班的时候又加进去了审批结果,初步尝试统计多头借贷不同审批方案的拒绝比率2、初步看了下joinquant,感觉做的比uqer要好,准备写一个简单的持仓最小市值,按一定时间换仓的策略3、然后对于变量之间的交叉影响做了一些分析,在统计学上应该叫分层分析,就是说一个变量X对于Y不显著,但是有可能存在一个因素,X在Z上分层,每一个分层就变得很显著了,这种变量间的交互

2016-12-01 09:56:06 232

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除