python pandas csv时间聚合_利用numpy和pandas处理csv文件中的时间方法

环境:numpy,pandas,python3

在机器学习和深度学习的过程中,对于处理预测,回归问题,有时候变量是时间,需要进行合适的转换处理后才能进行学习分析,关于时间的变量如下所示,利用pandas和numpy对csv文件中时间进行处理。

date (UTC) Price

01/01/2015 0:00 48.1

01/01/2015 1:00 47.33

01/01/2015 2:00 42.27

#coding:utf-8

import datetime

import pandas as pd

import numpy as np

import pickle

#用pandas将时间转为标准格式

dateparse = lambda dates: pd.datetime.strptime(dates,'%d/%m/%Y %H:%M')

#将时间栏合并,并转为标准时间格式

rawdata = pd.read_csv('RealMarketPriceDataPT.csv',parse_dates={'timeline':['date','(UTC)']},date_parser=dateparse)

#定义一个将时间转为数字的函数,s为字符串

def datestr2num(s):

#toordinal()将时间格式字符串转为数字

return datetime.datetime.strptime(s,'%Y-%m-%d %H:%M:%S').toordinal()

x = []

y = []

new_date = []

for i in range(rawdata.shape[0]):

x_convert = int(datestr2num(str(rawdata.ix[i,0])))

new_date.append(x_convert)

y_convert = rawdata.ix[i,1].astype(np.float32)

x.append(x_convert)

y.append(y_convert)

x = np.array(x).astype(np.float32)

"""

with open('price.pickle','wb') as f:

pickle.dump((x,y),f)

"""

print(datetime.datetime.fromordinal(new_date[0]),'------>>>>>>',new_date[0])

print(datetime.datetime.fromordinal(new_date[10]),'------>>>>>>',new_date[10])

print(datetime.datetime.fromordinal(new_date[20]),'------>>>>>>',new_date[20])

print(datetime.datetime.fromordinal(new_date[30]),'------>>>>>>',new_date[30])

print(datetime.datetime.fromordinal(new_date[40]),'------>>>>>>',new_date[40])

print(datetime.datetime.fromordinal(new_date[50]),'------>>>>>>',new_date[50])

结果

将csv文件中的时间栏合并为一列,并转为方便数据分析的float或int类型

52496fc9983531d9552d7708063f5e93.png

以上这篇利用numpy和pandas处理csv文件中的时间方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持易采站长站。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值