Python量化学习记录（持更）

feihua1475

已于 2022-10-13 10:04:29 修改

阅读量390

点赞数

文章标签：学习

于 2022-05-05 21:27:25 首次发布

本文链接：https://blog.csdn.net/feihua1475/article/details/124598049

版权

本文适合初学者，介绍了如何使用Python的Numpy和Pandas库进行数据处理，包括计算累积移动平均值和标准差，处理非数值数据类型，以及数据清洗技巧如整数补零和删除重复项。示例代码清晰易懂，帮助提升数据处理效率。

摘要由CSDN通过智能技术生成

入门量化不久的菜鸡，主攻基本面量化。python半系统性自学，有些小功能靠自己实现，代码效率可能较低或者存在错误，还请各位看官不吝赐教。

求累积移动平均值（标准差），应用.expanding()命令：对dataframe的某一列X，对每一行，建立新的一列X_mean求第一行到前一行的均值（标准差）
```
data['X_mean'] = data['X'].expanding().mean().shift(1)
data['X_mean'] = data['X'].expanding().std().shift(1)
```
data[‘xxx’].plot()报错no numeric data to plot，解决方案：转化为浮点型，
```
data['xxx'].astype('float').plot()
```
整数补零，注意区分类型为字符串还是整数：
```
df['xxx'].zfill(2)
```
df中X列有连续重复数字，可删掉后仅保留第一个或最后一个重复数字：
```
df.drop_duplicates('X',keep = 'first') # or keep = 'last'
```