我的pandas总结

第一个是关于使用statsmodels包提取调整后的R^2。
原来直接加在后面就行了。

def my_f2(x):
    temp_x = x['Ask Size'] - x['Bid Size']
    temp_y = x['mid quote return']
    temp_x = sm.add_constant(temp_x)
    results = sm.OLS(temp_y, temp_x).fit()
    return results.rsquared

https://www.statsmodels.org/stable/generated/statsmodels.regression.linear_model.RegressionResults.html

pands对数据框的一列按照时间进行分割的时候,好像是必须是索引。

BARC_COPY = BARC.set_index(['time'])
g1 = BARC_COPY['mid quote return'].resample('10s').std()

第一行就是将一列设置为索引,然后使用resample来设置分割,如果为5分组就是为5T。
添加链接描述

pandas的groupby可以依靠多列或者单列进行处理,但是agg好像只能对分组后的单列,因此,如果为了分组后对多列进行处理,可以使用for循环提取出每一组,然后对每一组进行处理,将处理的结果保存。

my_time = list()
val1 = list()
for name, group in BARC.groupby(BARC['time'].apply(lambda x: x.strftime("%Y-%m-%d %H:%M"))):
    my_time.append(name)
    val1.append(my_f2(group))

如果两个pd的series对象的列不对应,算出来的数值是缺失值的。
就是两个pd.series对应的索引必须一样。

pandas的索引和行变量进行转换:
添加链接描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yuanzhoulvpi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值