python提高文件读取速度_Python提高了HDF5文件的读取速度

最新推荐文章于 2023-03-25 17:30:32 发布

weixin_39603397

最新推荐文章于 2023-03-25 17:30:32 发布

阅读量1.1k

点赞数

文章标签： python提高文件读取速度

我正在构建一个存储财务数据的数据库(特别是选项链) .

我每天检索每个交易日的数据，即5d /周或250d /年 . 我这样做了300个代码，数据库正在以150Mb /天的速度增长，到目前为止达到了9Gb .

数据以pandas数据帧的形式出现 .

我想使用HDF5格式并在每个交易日使用组构建文件，然后在代码中进一步分支以及进一步“调用”/“放置”(选项行话)

这是编写文件的代码片段，我使用pd.HDFStore和for循环通过代码

db = pd.HDFStore('Database.h5')

group = c_year + '/' + c_month + '/' + c_day + '/'# Create main group from current day

for i in tickers['Symbol']:

db.put(group + i + '/Call', data, format = 'table', append = True, data_columns = True)

每个交易日写文件的速度很慢，但我得出的结论是，这都是关于使用pandas datareader检索数据

随后，我需要检索整个数据库，将其转换为减少的pandas数据帧以进行数据争用 .

这是仅为“调用”读取* .h5文件的代码，另一个用于循环遍历1年回顾期间的所有日期的代码

for i in tickers['Symbol']:

for date in datelist(dt.date.today() - timedel

最低0.47元/天解锁文章

weixin_39603397

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python提高文件读取速度_Python提高了HDF5文件的读取速度

我正在构建一个存储财务数据的数据库(特别是选项链) .我每天检索每个交易日的数据，即5d /周或250d /年 . 我这样做了300个代码，数据库正在以150Mb /天的速度增长，到目前为止达到了9Gb .数据以pandas数据帧的形式出现 .我想使用HDF5格式并在每个交易日使用组构建文件，然后在代码中进一步分支以及进一步“调用”/“放置”(选项行话)这是编写文件的代码片段，我使用pd.HDFS...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。