目录
Intro:
入门量化不久的菜鸡,主攻基本面量化。python半系统性自学,有些小功能靠自己实现,代码效率可能较低或者存在错误,还请各位看官不吝赐教。
数据处理(Numpy和Pandas)
-
求累积移动平均值(标准差),应用.expanding()命令:对dataframe的某一列X,对每一行,建立新的一列X_mean求第一行到前一行的均值(标准差)
data['X_mean'] = data['X'].expanding().mean().shift(1) data['X_mean'] = data['X'].expanding().std().shift(1)
-
data[‘xxx’].plot()报错no numeric data to plot,解决方案:转化为浮点型,
data['xxx'].astype('float').plot()
-
整数补零,注意区分类型为字符串还是整数:
df['xxx'].zfill(2)
-
df中X列有连续重复数字,可删掉后仅保留第一个或最后一个重复数字:
df.drop_duplicates('X',keep = 'first') # or keep = 'last'