r语言 月度消费频次_【大数据部落】R语言highfrequency高频金融数据导入

本文介绍了在R语言中如何使用highfrequency包处理高频金融数据,包括数据的导入、清理和整理。针对数据转换成xts格式的问题,提供了详细步骤,强调了时间数据作为行名的重要性,并给出了预处理数据的示例代码,以便后续使用HAR模型进行波动率预测等分析。
摘要由CSDN通过智能技术生成

R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型

都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:

 NYSE TAQ数据库中的.txt文件

 WRDS数据库中的.csv文件

 Tickdata.com的.asc文件

不易获取,因此,输入数据转换成xts,然后进行时间序列分析的过程中存在困难。

因此对于原始数据,我们可以整理成sample数据的格式,然后使用xts包先将其转换成xts格式。

对于时间序列数据要注意的一点是时间数据不单独作为一列,仅作为行名存在,否则在进行转换的过程中会出现colnames和列的数目不符合的错误。

因此对于数据可以先进行预处理。

对于列数据间分隔建议使用tab制表符,否则在r读取的过程中会将时间的日期时间识别为两列。

sample_tdataraw=read.table("E:\\AA_trades.txt",header=F,skip =

1,stringsAsFactors=FALSE)

其中读取时要注意跳过第一行,列名和列数不符的错误。

读取后,对列名赋值

colnames(sample_tdataraw)=c("

","SYMBOL","EX","PRICE","SIZE","COND",&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值