量化编程中的常用Pandas技巧

最新推荐文章于 2023-02-12 12:50:31 发布

小王同学WWW

最新推荐文章于 2023-02-12 12:50:31 发布

阅读量361

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44773050/article/details/100575250

版权

本文总结了Pandas在量化编程中的常用技巧，包括读取csv文件、数据类型转化、数据操作、统计函数、时间序列处理和缺失值处理等。通过掌握这些技巧，能提升量化分析的效率。

摘要由CSDN通过智能技术生成

转载地址：https://www.jianshu.com/p/ffde7c058678
常用pandas知识点回顾
1、读取csv文件，用pd.read_csv()即可，参数值有：

filepath_or_buffer=‘文件的路径’
sep=’,’,文件中列与列之间的分隔符，一般是逗号或者’\t’
skiprows=1，跳过第一行描述性语句
nrows=5，只读取前5行数据，若不指定，则读取全部数据。调试程序的时候常用，先读一部分，把代码写完再说。
parse_dates=[‘交易日期’]，将交易日期这一列的内容转化为日期格式。如果不写这个参数，则导入的该列将是string的格式。
index_col=[‘交易日期’]，将交易日期这一列指定为index
usecols=[‘交易日期’,‘股票名称’]，只读取某些列的数据
error_bad_lines=False, 当遇到低质量的数据，程序会报错，加上这个参数后，程序就会跳过报错的数据行，然后继续读取后面的数据，使程序能够正常运行下去。
na_values = null，将数据中的null全部识别为空值。
2、看df的形状，用df.shape，返回有多少行多少列。查看有多少行，用df.shape[0]，查看有多少列，用’df.shape[1]`。

3、显示每一行或每一列的名字，用df.index或df.columns。在for循环中常用。

4、查询每一列数据的类型，用df.dtypes。

5、随机抽几行数据来看看，用df.sample(n&

最低0.47元/天解锁文章

小王同学WWW

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。