记录量化程序编程过程的一些出错点和需要记录的点

data = pd.read_csv(file_root, encoding='utf-8',usecols=columns,parse_dates=['date'])
#参数 parse_dates=['date'] 是把列date设置为日期格式
#还可以加参数index_col="date" 这个是把列设置为索引,为什么不设置,是因为下面一行筛选需要一个
#值,不能用索引,否则会报错
return (data[(data['date']>=star_date) & (data['date']<=end_date)])
#筛选数据,date必须为普通行,如果设置成索引行可以用下面一行去掉索引
# data.reset_index(inplace=True)#去掉索引
data.set_index("date", inplace = True)
#这行是设置date为索引行,inplace为True是在原来的数据表上面更改
data.dropna(axis=0, thresh=4,inplace=True)
删除含有Nan值的行,thresh是条件,意思是如果一行内有4个以上有数值的话就不删除这一行,如果少于4个就删除这一行。inplace为True是在原来的数据表上面更改。axis=0表示以行为单位,axis=1表示以列为单位。
df.fillna(0,inplace=True)
可以把pandas数据表里的Nan值全部替换成0
df2.reset_index(inplace=True)#去除原来的搜引
pd.to_datetime(df2['FSRQ'])#把FSRQ列设置为日期格式

df.at的用法
作用:获取某个位置的值,例如,获取第0行,第a列的值,即:index=0,columns='a'
data = df.at[0, 'a']
 

#合并多个pandas表格的数据
frames=[data2,data1]#先把两个把放在一个数据里,排前面的数据要放前面,可以放两个以上
data2=pd.concat(frames)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值