Python量化学习记录(持更)

本文适合初学者,介绍了如何使用Python的Numpy和Pandas库进行数据处理,包括计算累积移动平均值和标准差,处理非数值数据类型,以及数据清洗技巧如整数补零和删除重复项。示例代码清晰易懂,帮助提升数据处理效率。
摘要由CSDN通过智能技术生成

目录

Intro:

数据处理(Numpy和Pandas)

Intro:

入门量化不久的菜鸡,主攻基本面量化。python半系统性自学,有些小功能靠自己实现,代码效率可能较低或者存在错误,还请各位看官不吝赐教。

数据处理(Numpy和Pandas)

  1. 求累积移动平均值(标准差),应用.expanding()命令:对dataframe的某一列X,对每一行,建立新的一列X_mean求第一行到前一行的均值(标准差)

    data['X_mean'] = data['X'].expanding().mean().shift(1)
    data['X_mean'] = data['X'].expanding().std().shift(1)
  2. data[‘xxx’].plot()报错no numeric data to plot,解决方案:转化为浮点型,

    data['xxx'].astype('float').plot()
  3. 整数补零,注意区分类型为字符串还是整数:

    df['xxx'].zfill(2)
  4. df中X列有连续重复数字,可删掉后仅保留第一个或最后一个重复数字:

    df.drop_duplicates('X',keep = 'first') # or keep = 'last'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值