pandas中根据指定日期降采样

学习searchsorted的使用

问题描述

计算私募基金超额收益率。基金会披露一段时间的净值变动,但私募基金净值披露日期并不固定,可能每周披露一次或几天披露一次,因此,计算基准指数收益率也需要根据基金净值披露日期来计算。

例如现在要分析明汯300指数增强产品超额收益,有如下数据:
在这里插入图片描述
指数日度数据:
在这里插入图片描述

解决方案

首先提取出明汯产品净值披露日期

mh_300_dates = pd.DatetimeIndex(mh_300.index)

计算沪深300在净值披露周期的收益率

def period_ret(data):
    ret = data.pct_change()
    return ((ret + 1).prod() - 1)

index_close.columns = pd.to_datetime(index_close.columns)
hs300_weekly_ret = index_close.loc['hs300'].groupby(mh_300_dates[mh_300_dates.searchsorted(index_close.columns)]).apply(period_ret)

重点解释这段代码的最后一行,先看mh_300_dates.searchsorted(index_close.columns)
在这里插入图片描述
可以看到,这段代码将index_close.columns中的每个日期对应到mh_300的日期索引中

再看mh_300_dates[mh_300_dates.searchsorted(hs300_ret_std.index)]
在这里插入图片描述

这段代码就是根据上一步的索引指向了对应的mh_300的日期,也就是要进行降采样的日期,为每个值指明了对应关系,就是告诉groupby要怎么分组

最后是apply(period_ret),定义的period_ret函数就是求一个区间内的累计收益率,对每个采样日期计算,即可求得每个采样区间内的指数累计收益率,就可计算产品超额收益率

mh_300_excess_ret = mh_300.iloc[:, -1].astype(float) - hs300_weekly_ret

总结

本文采用的方法灵活利用了searchsorted的特性,根据官网介绍,searchsorted是查找元素的插入索引以保持原序列有序。这种利用方式值得品味。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值