能源物联网中如何处理上报的大量数据问题的思路分析(题目有点长,但是我不介意它更长)--后续会继续补充...


V1.0


      今年年底,随着运营的新能源车的增多,车辆上报上来的各种can消息也飞速增长,传统的关系型数据库已经无法满足存储的需要,因为转而向非关系型数据库去寻求帮助。目前面临的问题:


        1,数据存储:large,粗略估计,明年预计每日过4亿;

        2,can消息频繁上报,造成入库不及时的堆积问题:入库太慢,然而上报太快;

        3,检索分析困难,后续数据挖掘艰难;

        4,实时数据/历史数据


     分析完问题,来说说最开始的一个思路:


        1,解决存储分析问题:使用HBase独立机房存储,使用第三方专用分析工具进行SQL化分析(主要是为了省事儿,你api比较6 也可api,你美你随意);

        2,解决消息堆积问题: 采用kafka进行一个分布式的消息缓存,将上报数据进行多partication消费,进行入库;

        3,解决实时查询问题:对于实时数据,不进行读库查询,每次can消息刷新到redis缓存中;

        3,细碎问题:

                          多数据来源问题;

                          解析中的数据清洗,格式化,过滤,标准化(目前还是以国标为主)问题;

                          。。。。。。。。


    未完待续。。。。。






                          


       

      

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值