看Mars数据库怎么将190M数据压缩进1.9M的

本文介绍了一个新能源车企车端数据存储项目,使用Mars数据库对大量车辆传感器数据进行压缩和存储的测试。在1秒录入40条数据并保持低资源占用的情况下,原始190M的parquet数据经过Mars数据库处理后压缩至1.9M,压缩比高达100:1。数据库建模、数据写入和校验过程展示了Mars数据库在数据组织和压缩上的优势。
摘要由CSDN通过智能技术生成

1.项目背景

        Mars数据库性能测试参见某新能源车企车端数据存储项目性能测试。将车辆上各种信号定时上传到中心服务器,由于数字信号多,采集频率快,从而数据量大,造成数据上行带宽压力以及流量费用等问题,现需要能够将数据先行进行压缩后,再上传至中心服务器。测试Mars数据库的数据压缩率以及数据录入性能:指标要求1秒能够录入40条数据,同时保持较低资源占用率,数据压缩率至少在10:1。

        一部新能源汽车需要需要处理的传感器信号在6000个左右,后期可能会增加1万个左右。这6000个信号中,最快的变量率在1ms,最慢的在1秒;数据量在1秒40万条记录左右,5分钟左右的数据,总量在7000万条。

2.数据准备

甲方给的是一段5分钟的parquet格式的数据量在194M大小的数据文件,同时还有一个数据信号列表数据。这194M parquet格式的数据也是压缩过后的数据,其采用时间、名称、值三列结构的表格式存储。下面先将数据解压、转换能够符合Mars数据库入库的格式的数据。

        a. 借助Python脚本,将Parquet格式的数据转换成CSV格式的数据,转换成CSV格式的目的是为了下一步能够较好的读取

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值