目录
2.6.4.MARS2存储引擎时序函数(time_bucket)
2.6.5.MARS2存储引擎时序函数(time_bucket_gapfill)
1.YMatrix简介
1.1.YMatrix数据库系统定位
- 超融合架构:微内核与 MPP(Massively Parallel Processing) 。
- 微内核:TP(HEAP 存储引擎 + 火山执行引擎),时序(MARS2 存储引擎 + 向量化执行引擎)。
- 关注全场景性能:写入能力、时序查询能力、OLAP 分析、机器学习性能以及 OLTP 能力等。
- 北京四维纵横自研,2020年8月成立,2021年5月通过信通院测试并发布MatrixDB 4.0。
- 北京四维纵横内部统称其为“超融合数据库”,主要发展方向为时序场景,兼容适配全场景。
1.1.创始团队介绍
1.2.YMatrix在数据流中的定位
1.3.YMatrix的发展历程
2.YMatrix技术架构
2.1.YMatrix超融合架构
2.2.YMatrix内部架构
2.3.YMatrix核心性能
3.YMatrix技术实现
3.1.什么是时序数据?
时序数据(Time-series Data)是充满变化的,它是业务系统中正在发生的、无限时长的动态电影。它具有丰富而强大的利用价值,不仅可以为企业降本增效提质,还可以为奋斗中的理想者找到合适的开拓方向。
YMatrix 认为时序数据主要由以下部分构成:
某些静态属性,即不会受时间流逝影响的固定属性。譬如冰箱品牌、设备编号、产地、购买地、出厂时间等。
某些动态属性,即会随时间流逝不断变化的属性。譬如冰箱的温度、湿度、耗电量等。有时候指标也称测点,即可测量的点。
某个时间点的值,譬如 2023-02-10 20:00:00。
某个时间时刻某个指标的值,譬如海尔冰箱在 20:00 的温度数据是 6.2。
3.2.时序数据特性有哪些?
YMatrix 中时序数据的定义:即时间序列数据,表示与时间强相关的有顺序的一系列数据。应用中通常表现为指标数据在不同时间点采集到的一系列数据点。
业务场景 |
数据操纵语句(DML) |
写入方式 |
查询需求 |
并发度 |
时序 |
INSERT / Appendly-only |
高频流式写入 |
基于时间的点查、明细、聚集;关联分析、复杂分析 |
高并发 |
OLTP |
INSERT / UPDATE / DELETE |
高频写入 |
点查 |
高并发 |
OLAP |
INSERT / 少量 UPDATE / 少量 DELETE |
低频批量写入(ETL) |
关联、聚集 |
低并发 |
3.3.为什么需要使用MXKV数据类型?
1、需要采集的指标过多,超过postgresql最多1600列的限制。
2、不同型号的设备采集指标集合差别较大,导致在回传数据时有大量的NULL值。
(无法预知指标集,可能导致表schema要经常变)