本文来源于量化小论坛股票量化板块精华帖,作者为z-coffee。
以下为精华帖正文:
一段时间没写帖子,其实一直在研究策略,只是从不同的角度去思考而已。熟悉我的老板其实清楚,我的炉子水平一般,基本不太依托炉子去合成因子【主要是马力菜,技能点没点这块】,但对我来说,其实一直没有太缺因子,更多的时候,只要凑齐基础的数据,因子也就一连串的生成,归根到底,对我来说,这些并不是什么特别的秘密,这一篇不会有太多的代码,更多是个人的思考,这个帖子更多从一个构建的思路去整理这个帖子。
对于因子来说,基本离不开基础数据的支撑,没有基础数据的因子,基本不存在。。但很多时候,我觉得,基础数据就是一个挺好的因子库,最直接的原因是基础数据基本都有其金融数据作为背后的逻辑支撑,很好解释一些常识及行为。
以股东户数数据为例:
添加图片注释,不超过 140 字(可选)
字段中有以上的基础信息,总的来说,这个数据是解释一个股票的户数有多少个,啥时候公告的,相对之前状态的变化,至于户均市值【这个需要吐槽一下,其实是冗余字段,还不如合成后直接写公式相除。但这次有了总的来说,是好的,省的去到处找总股本的数据。】
稍微发散一下,股东户数的增减,可以推导出股东户数增减比例,更直观解释下降的幅度,户均持股数可以推导出持有者的集中程度,户均市值可以推导出持有者的资金水平。
更进一步的,以户均市值来思考,如果叠加一个对总市值的中性化处理,得到的就是持有者的集中程度,和户均持股数就可以形成一个相互印证。
从状态去思考,户数变动不一定是单次就完成,到底分多少次会集中有效?公告日期间的涨跌幅的变动和股东户数下降的幅度的相关系数?
在这样的过程中,其实不断的带着问题去构建因子,就可以衍生出非常多有趣的因子。
归结思考,基于基础数据去构造因子,这里有个思维范式:
1、描述特征的因子,可以尝试挖掘状态变化的情况。
2、描述间歇的因子,可以尝试挖掘标的特征变动和变动的关系。
另一个扩展因子的思路,这是之前线下会中其实也提出过的,常见的量价因子,RPS/RSI/BOLL,这些指标,经典的指标中,直接用,有时候会面临失效的情况,其实可以尝试将其中纯用价描述的指标,用成交量,成交额等常见的股票基础要素去平替,比如Rps,就是描述涨跌幅相对全市场的排序,将其中的涨跌幅置换成区间累计成交量,是没有任何毛病,可以继续用的。
反之亦然,纯用量的因子也可以用价去替代。这里就不赘述。
看到这里,各位看官应该理解我为什么不太缺因子的原因了吧,太多的因子可以替代生成,挖是挖不完的。
结尾借用繁花的台词:
生命之树循环往复,我们知道自己在每个春天会开出什么样的花,也知道在秋天一定不会结出什么样的果。但我们依然会期待下一个冬去春来,繁花似锦。
春华秋实本是常态,潮起潮落亦是普遍,也许明天远不及心中所期盼,但坚持前行,相信终有一个终点能够回应这一路的披荆斩棘,共勉。