app信息管理平台项目查询语句_开源版TDengine实践——能源智能互联管控云平台...

本文介绍了一个基于TDengine的能源管控云平台项目,该平台实现了能源的实时监控、报表统计等功能。文章详细阐述了项目背景、总体架构,特别是TDengine作为核心数据引擎在数据插入、查询和集群搭建方面的优势,以及RESTful接口的使用和性能测试结果。
摘要由CSDN通过智能技术生成

1.项目背景

基于双汇发展对能源管控的需求,利用云平台技术以及电气自动化处理手段,对双汇发展的一级、二级、三级能源仪表进行整体改造,实现仪表组网,进一步通过边缘网关进行能源在线监测数据的采集,并上报至云平台,建立统一能源管理信息化系统,实现能源的实时监控、报表统计、能源流向分析与预测,降低企业单位产品能源消耗,提高经济效益,最终实现企业能源精细化管理。

2.总体架构

能源管控平台基于私有云构建,包括完整的IaaS层、PaaS层和SaaS层,而能源采集系统作为管控平台中最为重要的一环,采用TDengine作为核心数据引擎,通过Restful接口进行仪表在线数据插入,并实现大规模时序数据的高效稳定存储,同时,也为能源管控应用层提供实时数据查询、历史聚合统计、流计算和订阅服务等功能,实现能源地图监控、能耗预警、能源流向预测和能源互联综合决策,具体架构入下图所示。

8caff6f28172a63aa661dbf4f84c4d03.png
能源采集系统架构图

3.TDengine关键应用

3.1.Connector选择

本项目数据采集最关键的环节,就是将订阅到的MQTT数据插入到TDengine中,于是也就涉及到了TDengine连接器的选择,我们平时项目中java使用居多,而且JDBC的性能也相对较强,理论上,应该选择JDBC API,但最终选择了RESTful Connector,主要考虑以下几点:

1)简洁性

毫无疑问,RESTful通用性最强,TDengine直接通过HTTP POST 请求BODY中包含的SQL语句来操作数据库,而且TDengine本身作为时序数据库并不提供存储过程或者事务机制,基本上都是每次执行单条SQL语句,所以RESTful在使用上很简便。

2)可移植性

本项目的java应用都是部署在kubernetes中,所以向TDengine插入数据的java应用需要容器化部署,而之前了解到,JDBC需要依赖的本地函数库libtaos.so文件,所以容器化部署可能较为麻烦,而RESTful仅需采用OKHttp库即可实现,移植性较强。

3)数据规模

本项目数采规模不大,大约每分钟7000条数据,甚至后续数采功能扩展到其他分厂,RESTful也完全满足性能要求。

但总体来讲,JDBC是在插入与查询性能上具有一定优势的,而且支持从firstEp和secondEp选择有效节点进行连接(类似于Nginx的keepalive高可用),目前TDengine版本发布情况上看,JDBC的维护与提升也是重中之重,后续项目也可能会向JDBC迁移。

3.2.RESTful代码实现

1)ThreadPoolExecutor线程池

订阅EMQX和RESTful插入TDengine的代码写在了同一个java服务中,每接收到一条MQTT订阅消息,便开启一个线程向TDengine插入数据,线程均来自于线程池,初始化如下:

ExecutorService pool = new ThreadPoolExecutor(150, 300, 1000, TimeUnit.MILLISECONDS,new ArrayBlockingQueue<Runnable>(100), Executors.defaultThreadFactory(),new ThreadPoolExecutor.DiscardOldestPolicy());

线程池采用基于数组的先进先出队列,采用丢弃早期任务的拒绝策略,因为本次场景中单次RESTful插入数据量大约在100~200条,执行速度快,迟迟未执行完极可能是SQL语句异常或连接taosd服务异常等原因,应该丢弃任务。核心线程数设为150,相对较高,主要为了保证高峰抗压能力。

2)OKHttp线程池

在每个ThreadPoolExecutor线程中,基于OKHttp库进行RESTful插入操作,也是采用ConnectionPool管理 HTTP 和 HTTP/2 连接的重用,以减少网络延迟,OKHttp重点配置如下:

public ConnectionPool pool() {return new ConnectionPool(20, 5, TimeUnit.MINUTES);
}

即最大空闲连接数为20,每个连接最大空闲时间为5分钟,每个OKHttp插入操作采用异步调用方式,主要代码如下:

public void excuteTdengineWithSqlAsync(String sql,Callback callback) {try{
okhttp3.MediaType mediaType = okhttp3.MediaType.parse("application/octet-stream");
RequestBody body = RequestBody.create(mediaType, sql);
Request request = new Request.Builder()
.url(tdengineHost)
.post(body)
.addHeader("Authorization", "Basic cm9vdDp0YW9zZGF0YQ==")
.addHeader("cache-control", "no-cache")
.build();mOkHttpClient.newCall(request).enqueue(callback);
} catch (Exception e) {logger.error("执行tdengine操作报错:"+ e.getMessage());
}
}

3)java打包镜像

长期压力测试显示,每秒执行200次RESTful插入请求,单次请求包含100条数据,每条数据包含5组标签,java服务内存稳定在300M~600M。而且上述模拟规模仅针对单个java应用而言,在k8s可以跑多个这样pod来消费不同的mqtt主题,所以并发能力完全够用。打包镜像时,堆内存最大值设为1024MB,主要语句为:

ENTRYPOINT ["java","-Djava.security.egd=file:/dev/./urandom","-XX:MaxRAM=2000m","-Xms1024m","-jar","/app.jar"]

3.3.性能测试

1)RESTful插入性能

按照3.2小节中的RESTful代码进行数据插入, java程序和TDengine集群均运行在私有云中,虚拟机之间配备万兆光纤交换机,java程序具体如3.2小节所示,TDengine集群部署在3个虚拟机中,配置均为1T硬盘、12核、12G(私有云中CPU比较充裕,但内存比较紧张),经过大约三周的生产环境运行,性能总结如下:

表1 生产环境下RESTful插入性能测试

Insert行数Insert语句字节数耗时(ms)
52823
3321365
7032408
156920512

生产环境下,单条插入性能极高,完全满足需求,当然前期也进行过稍大规模的插入场景模拟,主要是基于2.0.4.0以后的版本,注意到2.0.4.0之前的TDengine版本RESTful的sql语句上限为64KB。模拟环境下,RESTful插入性能非常优秀,具体入下表所示。

表2 模拟环境下RESTful插入性能测试

Java并发客户端数量Insert总行数Insert语句总字节数耗时(ms)
51万600,000260
52万1200,000480
86万3600,000700

2)RESTful查询性能

使用RESTful进行sql查询时,性能也是非常好,目前真实生产环境中,数据总量为800万,相对单薄,所以查询性能测试在模拟环境下进行,在8亿数据量下,LAST_ROW函数可以达到10ms响应速度,count、interval、group by等相关函数执行速度均在百毫秒量级上。

3.4.实施方案

本项目针对双汇发展下属的6个分厂(后续会继续扩充)进行能源数据采集,大约1200多块仪表(后续会继续扩充),每块仪表包括3至5个采集标签,采集频率均为1分钟,数据接入规模不大。六个厂各自有独立的租户空间,为了方便各自的时序数据库管理,同时也方便各厂间的聚合查询(目前六个分厂均从属双汇发展总部),所以各分厂分别建立超级表,每个超级表包括4个tag,分别为厂编号、仪表级别、所属工序和仪表编号,具体超级表建表情况如下图所示。

30a05a891c95c82b8b561aba2173f344.png

主要用到的集群包括TDengine集群、EMQX集群和Redis集群,其中Redis集群在数据采集方面,仅仅用于缓存仪表连接状态,其重点在于缓存业务系统数据;EMQX集群用于支撑MQTT数据的发布与订阅,部署在Kubernetes中,可以实现资源灵活扩展;TDengine集群部署在IaaS虚拟机中,支持大规模时序数据的存储与查询。

表3 集群配置信息

集群名称部署规模虚拟机数量虚拟机配置
TDengine集群三节点分布式3cpu: 12核内存:12G存储:1T
EMQX集群三节点分布式3cpu: 8核内存:12G存储:500G
Redis集群一主两从三哨兵3cpu: 4核内存:12G存储:500G

按照TDengine官方的建议,“一个数据采集点一张表,同一类型数据采集点一张超级表”,我针对不同分厂的水表、电表、蒸汽表和燃气表分别建立的超级表,每个仪表单独建表,保证每张表的时间戳严格递增。在实践TDengine的过程中,重点体会如下

1)集群搭建门槛低

TDengine集群安装部署非常便捷,尤其相比于其他集群,仅需要简单的配置就可以实现生产环境级的搭建,官方文档也比较丰富,社区活跃,也大为降低了后续运维成本。

2)插入与查询效率极高

TDengine的插入与查询性能极高,这点在实际运行时也深有感触,用last_row函数查询仪表最新数据,基本上可以达到毫秒级,在几十亿级的数据上进行聚合查询操作,也可达到百毫秒级,极大提供了系统的响应速度。

3)全栈式时序处理引擎

在未使用TDengine之前,我们主要采用InfluxDB/Redis和Kafka/Redis/HBase/Flink两种技术栈实现数据采集,对于我们中小型研发团队来讲,无论是系统搭建,还是实施运维都非常棘手。但是使用TDengine后,一切都简化了,TDengine将数据库、消息队列、缓存、流式计算等功能融合一起,以一种全栈的方式,为我们实现数据采集系统带来了便捷。技术方案的对比如表2所示。

表4 数据采集方案对比

技术方案说明优点缺点
InfluxDB/Redis直接将实时数据存入Redis,历史数据存入InfluxDB部署易上手,社区成熟1)InfluxDB查询与插入效率不高,集群版收费
2)无法直接集成开源版EMQX Broker
Kafka/Redis/HBase/Flink将采集数据发布到Kafka,利用Flink将实时数据存入/Redis,历史数据存入HBase1)消息吞吐量大2)流计算功能丰富,生态成熟3)集群版开源1)技术体系庞大,部署运维成本高
2)HBase插入性能可能无法满足Kafka的吞吐量
3)无法直接集成开源版EMQX Broker
TDengine直接将采集数据存入TDengine1)部署便捷,运维简单2)集群版开源3)订阅功能和流计算功能完善4)插入与查询效率极高5)资源占用少6)可与开源版EMQX Broker直接集成暂时不支持时序数据的更新与删除(后续会支持)

从表2的对比方案中可以看出,TDengine是有着很大的优势,尤其在开源EMQX Broker的支持上也非常好(主要依赖于Restful接口),其他的例如Kafka和InfluxDB只能和企业版EMQX集成;在数据插入和查询效率方面,进行TDengine、HBase和InfluxDB的对比,官网有非常详细的测试报告,TDengine也是绝对的优势,这里就不过多叙述。所以选择TDengine是势在必行的。

3.5.技术期望

在时序数据库性能方面,TDengine有着很大的优势,并且也集成了消息订阅和流计算功能,可以说在中小型物联场景下,是无需部署Kafka和Flink的。当然个人理解TDengine不是为了完全取代Kafka和Flink而生的,尤其是在大型云服务项目中,更多是共存。

但是在边缘端,TDengine凭借着极低的资源占用率和优秀的时序处理性能,将会产生更大的能量,也期望TDengine能更大程度地集成边缘流计算和mqtt broker等功能,扩充Modbus、OPC-UA等常见工业协议支持,向下连接工业设备或者物联设施,向上和边缘K8S生态(如KubeEdge、K3S等)协同,或者直接和云中心协同。

3.6.系统运行界面

项目重点是能耗统计,而在线采集到TDengine里的数据都是累计量,所以在计算能耗时,需要在不同的超级表执行按表分组、按时间周期采样的查询,类似下面语法:

select last(累计列) as max_val,first(累计列) as min_val from [超级表名] where [标签栏相关过滤] and ts>=now-10h INTERVAL(1h) group by [仪表编号] ;

得益于TDengine的极佳性能,基本能保证不超过百毫秒的访问延时,下面是一些相关的PC端、移动端界面(我们移动端是用H5做的,为了直接能跑在Android和iOS上)。

51461b2ca2fb84ba259351cdbd49a9b1.png

00e46128d47045f31184d030ce368613.png

b7e880f8c5a76f207d67aeda098fd7da.png

4.鸣谢

其实从19年开始就一直在关注TDengine,也看了很多陶总的演讲,受益匪浅,尤其在今年8月份,TDengine进行了集群版开源,也正好准备启动能源数据采集项目,所以果断采用TDengine作为核心时序引擎,目前也是收获了非常的效果。计划在后续其他项目也也会继续推广TDengine,同时也愿意为一些商业版功能付费,支持国产,支持涛思。

本次项目实施过程中,尤其感谢涛思数据的苏晓慰工程师,多次协助解决TDengine相关的实施问题,其实大部分都是我个人使用不当造成的问题,最后祝TDengine越来越好!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值