什么是实时数据,有哪些特征及与离线数据的对比分析

实时数据是工业物联网建设中经常遇到的一种数据类型,一般采用实时数据库来管理与存储,实时数据库是采用实时数据模型建立起来的数据库,用于处理不断更新的、快速变化的数据及具有时间限制的事务处理。实时数据库技术是实时系统和数据库技术相结合的产物,利用数据库技术来解决实时系统中的数据管理问题,同时利用实时技术为实时数据库提供时间驱动调度和资源分配算法。实时数据库是工业领域信息化的核心基础软件,是大数据、云计算和物联网等产业的核心支撑软件。

未来公司的重大决策将从【经验决策】到【实时数据驱动决策】,让一切行动以数据为基础,所有决策都基于定量分析,形成公司的决策事实。

一、实时数据特性:

时间约束、 事务调度、 数据存储、 数据在线压缩等。

二、通用的数据处理流程
三、实时数据与离线批处理数据的特征对比
四、流处理、分块流处理和批处理的对比
  1. 流处理: 无界,实时,无需对整个数据集执行操作,只对系统传输的每个数据项执行操作;适合实时统计
  2. 分块流处理:定制下的无界,实时,需要对部分数据集执行操作, 无需对整个数据集,只对系统传输的每个数据项执行操作;适合实时统计
  3. 批处理: 有界且大量、持久,适合访问全套记录才能完成的计算工作;适合离线统计
五、实时数据库、关系数据库和内存数据的对比
六、实时数据库常见的压缩算法:
实时数据库都是采用压缩存储,压缩有有损和无损压缩, 一般实际应用,流程工业采用10:1的压缩很合适,超过此数据,会发现大量有用的细节都不见了。
实时数据库方面常见的压缩算法是 Huffman( 哈夫曼 ) 算法,无损压缩, 属于可变代码长度算法一族, 意思是个体符号(比如,文本文件里的字符)用一个特定长度的位序列替代, 频率高的符号,使用短的位序列。而那些非常少出现的符号。则用较长的位序列。
Huffman编码流程
1.扫描要压缩的文件,对字符出现的频率进行计算。
2.把字符按出现的频率进行排序,组成一个队列。把出现频率最低(权值)的两个字符作为叶子节点。
3.它们的权值之和为根节点组成一棵树。
4.把上面叶子节点的两个字符从队列中移除,并把它们组成的根节点增加到队列。
5.把队列又一次进行排序。
6.反复步骤 3、4、5 直到队列中仅仅有一个节点为止。
7.把这棵树上的根节点定义为0(可自行定义0或1)左边为0 。右边为1 。
这样就得到每个叶子节点的哈夫曼编码了。
假设树的左边用0表示右边用1表示,如上方图e。则每个数能够用一个01串表示出来。
编码示例如下( 每个01串,既为每个数字的哈弗曼编码)
1–>110
2–>111
3–>10
4–>0
比如1 这个数字。用整数写进计算机硬盘去存储,占用了32个二进制位(8Byte), 而假设用它的哈弗曼编码去存储,仅仅有110三个二进制位,大大节约了存储空间。
七、通用数据处理计算的技术架构:一般架构设计的原则主要遵循合适、简单和演化原则,不要过度设计。 
八、实时数据处理的开源方案
目前比较流行的开源解决方案是Aapache Druid, Druid是一个分布式的、支持实时多维OLAP分析的数据处理系统。
Druid优势
  1. 亚秒响应的交互式查询,支持较高并发。
  2. 支持实时导入,导入即可被查询,支持高并发导入。
  3. 采用分布式 shared-nothing 的架构,可以扩展到PB级。
  4. 支持聚合函数,count 和 sum,以及使用 javascript 实现自定义 UDF。
  5. 支持复杂的 Aggregator,近似查询的 Aggregator 例如 HyperLoglog 以及 6. Yahoo 开源的 DataSketches。
  6. 支持Groupby,Select,Search查询。
  7. 不支持大表之间的Join,但其 lookup 功能满足和维度表的 Join。(最新版0.18已经支持Join,具体性能待测试)

Apace实时历史数据库ApaceRDB是长沙软动信息科技有限公司自主研发的一套基于分布式事务型的通用实时数据库系统,它可以应用于现代工业企业,包括电力、石油、矿山、化工、钢铁、电信、航空等领域,为这些行业的SIS监控系统、仿真系统等提供数据保障。 Apace实时历史数据库Apace提供对实时时序数据的压缩、计算、存储、告警、分发、查询、统计功能,同时,为上层业务系统开发提供了丰富的应用接口,包括组态设计器以及Excel扩展报表插件。 Apace实时历史数据库系统引入了多种创新的技术和理念,各方面的指标在同类软件中都名列前茅。在实时数据采集方面,Apace可以在一台普通服务器上稳定的承载百万点的数据同步更新;在历史数据处理方面,在对多种压缩算法进行研究改进后,创造了Apace独有的魔方无损压缩算法,1万点1年的历史数据仅需5.8GB的空间。同时,Apace独创的索引技术,可以实现检索的时间无关性,即可以从几十、上百年的历史数据中高效的检索任一时间点的数据;在告警服务里,Apace首度提出了趋势拟合和波动拟合告警,这项技术让Apace的告警能力得到了质的飞跃,可实现更为复杂的告警规则;在计算服务方面,计算规则可以采用C#、VB.NET或JScript语言进行编写,支持程序集动态引用技术,算法设计者可以使用自定义的第三方程序集(如VC动态链接库),强化了计算服务的计算能力。 Apace实时历史数据库Apace组态图设计器,可以轻松的设计出仿真式组态图、趋势图、报表等各种所需的组态图,Apace已经为用户提供了20多种基础元件,除了这些基础元件以外,用户还可以根据行业的需要来自定义新的元件;组态图支持客户端脚本编码,可对图中各个元件进行编码控制。在设计过程中,可以随时对组态图进行预览,以查看实际效果,设计完成后通过内置的发布功能,可随时发布到指定的服务器上以供使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一望无际的大草原

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值