量化编程中的常用Pandas技巧

本文总结了Pandas在量化编程中的常用技巧,包括读取csv文件、数据类型转化、数据操作、统计函数、时间序列处理和缺失值处理等。通过掌握这些技巧,能提升量化分析的效率。
摘要由CSDN通过智能技术生成

转载地址:https://www.jianshu.com/p/ffde7c058678
常用pandas知识点回顾
1、读取csv文件,用pd.read_csv()即可,参数值有:

filepath_or_buffer=‘文件的路径’
sep=’,’,文件中列与列之间的分隔符,一般是逗号或者’\t’
skiprows=1,跳过第一行描述性语句
nrows=5,只读取前5行数据,若不指定,则读取全部数据。调试程序的时候常用,先读一部分,把代码写完再说。
parse_dates=[‘交易日期’],将交易日期这一列的内容转化为日期格式。如果不写这个参数,则导入的该列将是string的格式。
index_col=[‘交易日期’],将交易日期这一列指定为index
usecols=[‘交易日期’,‘股票名称’],只读取某些列的数据
error_bad_lines=False, 当遇到低质量的数据,程序会报错,加上这个参数后,程序就会跳过报错的数据行,然后继续读取后面的数据,使程序能够正常运行下去。
na_values = null,将数据中的null全部识别为空值。
2、看df的形状,用df.shape,返回有多少行多少列。查看有多少行,用df.shape[0],查看有多少列,用’df.shape[1]`。

3、显示每一行或每一列的名字,用df.index或df.columns。在for循环中常用。

4、查询每一列数据的类型,用df.dtypes。

5、随机抽几行数据来看看,用df.sample(n&

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值