车联网海量数据存储与分析是典型的大数据应用场景:车载终端连接车辆内部CAN控制总线,实时收集车辆数据。一部分数据通过无线通讯方式及时传给后台以满足对车辆状态及故障状态实时监控的需求;其余大部分数据将先进行本地存储(如SD卡),再通过离线导入存储在大数据框架中,以便后续进行深度挖掘。
恒润科技针对车联网大数据平台(后称‘大数据平台’)的架构规划请见下图。
数据源
大数据平台的数据源包括两类数据:
• 车载终端数据
系统规模由车载终端并发接入量与消息并发处理需求决定,其特点为增长迅速,数据类型繁多且数据格式多变。大数据平台必须可能保证车载终端高并发远程接入并传输数据。同时还应兼顾历史数据的导入,传统数据存储及分析方式往往以两种形式处理这些车载终端数据:一是用传统型关系型数据库,二是用文件系统。
• 应用数据
应用系统相关数据,数据相对较小,增长较慢。数据结构与应用强相关且较为稳定。
数据传输
针对上述数据源,大数据平台应提供相应的数据传输接入工具:
• 车载终端数据
♦实时数据
大数据平台应支持多设备同时接入并进行数据传输。高并发的规模应考虑在十万级别。
♦历史数据
大数据平台应提供面向关系型数据库与文件系统的数据导入接口。
♦通讯协议
如果车载终端由不同供应商提供且使用不同的私有自定义通讯协议,大数据平台应提供私有协议解析适配功能。
• 应用数据
大数据平台不应对建设在其上的应用系统附加限制,如开发语言,通讯协议等。大数据平台应遵循‘面向服务架