CSV数据——时间索引

CSV数据准备的问题

1.read_csv()参数

from pandas import read_csv
from datetime import datetime
# load data
def parse(x):
	return datetime.strptime(x, '%Y %m %d %H')
dataset = read_csv('raw.csv',  parse_dates = [['year', 'month', 'day', 'hour']], index_col=0, date_parser=parse)
dataset.drop('No', axis=1, inplace=True)
# manually specify column names
dataset.columns = ['pollution', 'dew', 'temp', 'press', 'wnd_dir', 'wnd_spd', 'snow', 'rain']
dataset.index.name = 'date'
# mark all NA values with 0
dataset['pollution'].fillna(0, inplace=True)
# drop the first 24 hours
dataset = dataset[24:]
# summarize first 5 rows
print(dataset.head(5))
# save to file
dataset.to_csv('pollution.csv')

日期解析
datetime.strptime(x, ‘%Y %m %d %H’)
strptime():把str转换为datetime。
strftime():把datetime转换为str。

parse_dates = [[‘year’, ‘month’, ‘day’, ‘hour’]]

  1. [‘year’, ‘month’, ‘day’] -> 解析3列的值作为独立的日期列;
  2. [[‘year’, ‘month’, ‘day’]] -> 合并3列作为一个日期列使用
  3. {‘time’ : [‘year’, ‘month’, ‘day’]} -> 将1,3列合并,并给合并后的列起名为"time"

date_parser=parse
用于解析日期的函数。

【实际使用】日期可以设置为datetime格式,并设置为index。

df = pd.read_csv('laixi_day_finished.csv', encoding='utf-8', index_col='time')
df.index = pd.to_datetime(df.index)  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值