1、又看了下joinquant,按财务指标选股的时候不加filler似乎可以挑选出全部A股的股,但是奇怪的是有个停牌(或者说已经退市的)出现在了名单之中(300372欣泰电气),是12月2号的数据,然后看了下小市值策略的代码,有两个做记录的成员变量,我不太清楚其意义何在?然后回测的持仓数据来看,可能存在一定的幸存者偏差,几乎之前的全是st股,然后我又用他所谓的40000%的去除st,去除停牌那个策略,回测太高了,高达70%+,根本不敢用啊!我要继续熟悉下joinquant的回测框架,确保回测结果是正确的。
2、然后下午主要就是重新建模加部署,写SQL,SQL过程中没有什么值得记录的地方,然后临近下班的时候开始弄一个问题就是如果不用woe,logistic自变量中的分类变量该怎么办,和博士讨论了下,自己也去查了下,一种普遍的说法是转换成哑变量,3类就是两个自变量,还有待进一步研究,可能虽然说我对于信用评分领域比较熟悉了,但是算法本身和应用场景我还不能称得上精通!