FOF组合筛选基金的偏差

 当前,私募基金的数量已近10万只,相较于股票的5000多只,近20倍的差异。因此在筛选私募基金时,需要进行过滤和清晰非目标数据,缩小目标数据的数量。在清洗过滤的过程中,需要重点考虑四种类型的偏差(生存偏差,分类偏差,样本偏差,对比期偏差),否则很有可能导致结果不可靠。

1. 生存偏差

相较于公募基金而言,私募基金的数据容易出现缺失,主要有两点原因:管理人不愿意将所有的基金净值对外进行公布;对于表现较差的基金,管理人大部分情况下都会选择不进行公布。因此,在我们可获取的私募基金样本数据中,大部分中表现太差,甚至已经清盘(无法生存)的数据已经被剔除。这种生存偏差,会使得我们筛选的数据整体的收益率表现相对全量而量更优秀,回测的FOF组合绩效表现更优。

对应的优化思路:生存偏差的影响下,样本数据的整体表现高于实际情况;可以考虑:1. 降低FOF组合的回测收益率;2. 提出部分表现较好的基金,使整体基金的表现更接近于实际的均值情况。

2. 分类偏差

FOF组合的特点之一是分散化投资,因此需要对基金进行策略分类,降低在某个单一策略上的权重,简单来说,不同策略类型基金的表现也存在较大的差异,若不进行分类,会导致筛选出的基金存在聚类的特点。在对基金进行策略分类的过程中,会存在分类偏差,主要存在以下两种情形:1.部分基金的策略类型比较模糊,不容易界定,比如多策略基金和组合基金;2. 部分基金可以归类为多种策略类型,比如量化多头可以归类为量化策略,也可以归类为股票多头策略。由于分类的偏差,可能导致影响最终的结果。

对应的优化思路:其实,目前市场上没有标准化的分类依据;可以考虑的思路:1.制定合理的分类标准,不一定要多么精准和完善,但是需要具备清晰的逻辑;2.初筛后,进行二次的调整分类。

3. 样本偏差

在样本的数据中,存在以下两种常见情况:1.单一管理人旗下存在多只业绩一致性较高的基金(例如,测试1号基金A期,测试1号基金B期);2.单个投资经理旗下存在多只业绩一致性较高的基金(例如,甲旗下的A,B,C)。上述情况,即产生了样本偏差,对应会造成一定程度上数据的重复,增加了数据筛选复杂度的同时,还可能影响筛选的结果。

对应的优化思路:矛盾点在于数据的隐性重复;可以考虑:1. 选择管理人某一系列下一只代表性基金作为样本,其余的剔除;2.选择投资经理某一策略下一只代表性基金作为样本,其余的剔除。

4. 对比期偏差

对比期的偏差比较好理解,比如我们选择了10只基金,但是这10只基金的实际运作日期不一致,那么直接比较其有史以来的业绩是不太合理的。毕竟,不同统计区间行情的表现差异很大。这里还需要提醒一点,我们在计算基金业绩的时候,尽可能剔除期初净值没有变化的那一段时期的数据(成立期--实际运作),数据尽可能使用实际运作开始的数据,这样相对来说更加准确。对比期的偏差会使得样本数据之间的业绩表现差异过大,影响筛选的结果,而这个偏差实际上致命的,必须格外注意。

对应的优化思路:核心做法是尽可能在数据总量和样本区间的一致性上做出均衡的取舍:1.对于业绩区间远低于样本区间的数据,直接剔除(笔者比较喜欢四舍五入,例如统计区间为3年,业绩区间低于2.5年及以下就剔除);2.样本区间不要设置的太长(笔者比较喜欢3-5年,区间太长了数据也可能出现滞后,太短了又不具备稳定性)。

最后,想总结一下:基金数据的筛选只是一种方法,甚至说一种辅助手段,不能过度依赖,但是在使用过程要注意以上四类偏差,降低对结果的影响;关于FOF,笔者的理解是不需要选中所谓的大牛基金(毕竟盈亏同源),更多是能够控住下限,能够选中表现中能偏上的基金,对于FOF而言,已经是难能可贵,这里也不是摆烂找借口,而是当下实际情况结合FOF本身特点的实事求是。

本期分享结束,有何问题欢迎交流。

  • 17
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值