
SPL
文章平均质量分 94
石臻臻的杂货铺
CSDN博客之星Top5 ,石臻臻《Kafka运维与实战宝典》电子书作者(可找我:szzdzhp001下载)、 Kafka Contributor 、 KnowStreaming PMC、Nacos Contributor、华为云 MVP 。 滴滴Kafka技术专家 、
展开
-
可路由计算引擎实现前置数据库
很多大机构都会有个中央数据仓库负责向应用提供数据服务。随着业务的发展,中央数据仓库的负载在持续增加。一方面,数仓是前端应用的数据后台,而前端应用不断增多,用户访问的并发数也不断增长。另一方面,数仓还要承担原始数据的批量离线处理,而批量任务不断增加,其数据量和计算量也在不断增大。所以,常常会出现中央数据库不堪重负的情况。表现出来的现象是:批量处理任务耗时过长,远远超过业务可以容忍的时限;在线数据查询响应太慢,用户长时间等待,满意度越来越差。特别是月末或者年末,计算量达到高峰的时候,这些问题会更加严重。原创 2023-02-06 14:09:07 · 29243 阅读 · 51 评论 -
SPL 实现电力高频时序数据实时存储统计
在第二步中已经提到,数据量较大时,无法将数据都放在内存中计算,所以考虑采用冷热分层方案,将数据分为三层,每天的冷数据按测点号、时间有序(下文中的所有外存文件存储均采用该序,不再重复说明),用组表存储,因为大表对性能的影响很大,存储成组表有利于提升系统整体性能;第四层,每天的组表冷数据。系统中,用户期望的统计响应延迟为:从20万个测点中任取100个测点,统计频率最高可能每隔若干秒调用一次,从总时间跨度中统计任意一天的数据,预期执行时间在1分钟内,另外还会有少许离线任务,最长的时间段跨度长达一年。原创 2023-01-04 08:30:00 · 62959 阅读 · 52 评论 -
从SPL看开放计算能力的意义
关系数据库提供了SQL,因而有较强的计算能力,但很遗憾的是,这个计算能力是封闭的。所谓计算封闭性,是指要被数据库计算和处理的数据,必须事先装入数据库之内,数据在数据库内部还是外部是很明确的。与之相对,计算开放性是指数据无需进入内部就可以直接处理多种来源的数据。数据库有元数据,使用前要先定义表,数据要经过整理满足约束才能入库使用,封闭也就成了自然而然的事情了。反过来,什么样的计算能力是开放的呢?数据在使用之前无需整理就可以直接计算,没有任何约束限制,使用起来很灵活。现在有很多这样的开放数据计算引擎,Spark原创 2022-12-06 08:30:00 · 13885 阅读 · 45 评论 -
SPL比SQL更难了还是更容易了?
SPL作为专门用于结构化和半结构化数据的处理技术,在实际应用时经常能比SQL快几倍到几百倍,同时代码还会短很多,尤其在处理复杂计算时优势非常明显。用户在看到这些应用效果后对SPL往往很感兴趣,但又担心掌握起来太难,毕竟SPL的理念和语法都跟SQL有较多不同,这要求用户需要重新了解一些概念和学习新的语法,用户可能会心生疑虑。那么SPL的上手难度究竟如何呢?这里我们以SQL为起点讨论一下这个问题。原创 2022-11-07 10:26:21 · 21096 阅读 · 67 评论 -
国产CPU执行SPL实现数据库运算的性能实用性测试
国际大环境就不用多说了。对于数据库类的关键业务,全国产技术(国产CPU+国产数据库)和国外主流技术在性能上相比还有不小的差距,经常需要借助分布式技术使用数倍的硬件才能获得类似的效果。国产编程语言SPL的问世,可以方便程序员写出(比SQL)更短小简单且计算量更低的代码(针对同样计算任务),能够对采用SQL的主流数据库形成明显的效率和性能优势。这样,在国产CPU上运行用SPL编写的数据库运算,就可能获得在国外CPU上运行SQL数据库的同样性能,甚至大幅超过。从而使数据库运算类的关键业务实现全国产技术替代。本次测原创 2022-10-19 10:50:32 · 10398 阅读 · 10 评论 -
SPL工业智能:原料与产品的拟合
此外,工艺知识还提供了基础收率,它是个长期均值,直接用它预测“明天” 的产品产量效果很差,好比用年均气温去预测明天气温,显然无效,所以基础收率不能直接使用,只能作为参考,就像预测“明天”气温可以把年均气温作为参考一样,不能偏离特别远,否则即使拟合结果误差很小也不合适用于预测。同理,实际生产中,收率同气温一样也是渐变的,即今天的收率和明天的收率差别不会很大,可以把今天的收率和基准收率得到的产品产量之差作为计算明天收率的参考,以此作为有边界拟合时的边界,保证结果收率不偏离基础收率太远。原创 2022-10-10 10:22:32 · 10436 阅读 · 75 评论 -
SPL 工业智能:识别指定工况
文中的代码也是示意性的,为每种示例写了相应的代码,实际上,可以只写一段通用的代码,根据不同的参数来识别不同的工况,当然代码会复杂一些,全部写出会占用过多篇幅,这里就省略了,有兴趣的读者可以和我们联系沟通。工业生产过程中会产生大量的数据,比如电压、温度、流量等等,不同的工况条件下,数据的走势不同,比如产量稳定时,流量走势平稳,产量增加时,流量势必也会增加,体现在图像上就是流量曲线上升。振幅升降指数是描述振幅升降情况的指数,和升降指数描述原值升降情况一样,RL大于0,振幅上升,RL小于0,振幅下降。原创 2022-09-19 09:35:47 · 24790 阅读 · 75 评论 -
SPL工业智能:发现时序数据的异常
那么发现异常的任务就转换为发现不常出现的情况,判断数据是否不常出现,就是看当前数据相较于之前一段时间内的数据是否不常出现。利用之前一段时间数据学出一个模型E,用它来判断当前数据是否异常。比如之前一段时间的数据在1。原创 2022-09-07 08:57:02 · 19990 阅读 · 78 评论 -
还在纠结报表工具选型吗
还是那句话,如果有个功能无穷好,价格无穷低的产品,那选型当然就不用纠结了润乾报表就是接近这个理想的存在,它的功能接近无穷好,因为它一直是行业的功能标杆,它的价格也接近无穷低,因为它一年3W就可以不限数量、节点的去使用最高版本,平摊下来单套的成本可能都不过百功能全面、低价透明的润乾,已经逐渐让大家都形成了一种共识:选报表,就按着润乾报表的功能和价格去选就行了,报表工具的选型,再也没什么好纠结的了。...原创 2022-08-29 07:00:00 · 10858 阅读 · 33 评论 -
HTAP应该是一种需求 而不是一种产品
作者:石臻臻,CSDN博客之星Top5、、、华为云 MVP,腾讯云TVP,滴滴Kafka技术专家、。。原创 2022-08-15 07:30:00 · 13844 阅读 · 78 评论 -
Hadoop Spark太重,esProc SPL很轻
作者石臻臻,CSDN博客之星Top5、、、华为云MVP,腾讯云TVP,滴滴Kafka技术专家、。。原创 2022-08-01 11:22:47 · 12303 阅读 · 66 评论 -
开源SPL强化MangoDB计算
MongoDB是NoSQL数据库的典型代表,支持文档结构的存储方式数据存储和使用更为便捷,数据存取效率也很高,但计算能力较弱,实际使用中涉及MongoDB的计算尤其是复杂计算会很麻烦,这就需要具备强计算能力的数据处理引擎与其配合。开源集算器SPL是一款专业结构化数据计算引擎,拥有丰富的计算类库和完备、不依赖数据库的计算能力。SPL提供了独立的过程计算语法,尤其擅长复杂计算,可以增强MongoDB的计算能力,完成分组汇总、关联计算、子查询等通通不在话下。...原创 2022-07-19 08:30:00 · 16654 阅读 · 123 评论 -
【云原生】内存数据库如何发挥内存优势
与以磁盘存储为主的普通数据库相比,内存数据库的数据访问速度可以高出几个数量级,能大幅提高运算性能,更适合高并发、低延时的业务场景。不过,当前大部分内存数据库仍然采用 SQL 模型,而 SQL 缺乏一些必要的数据类型和运算,不能充分利用内存的特征实现某些高性能算法。仅仅是把外存的数据和运算简单地搬进内存,固然也能获得比外存好得多的性能,但还没有充分利用内存特征,也就不能获得极致的性能。下面我们来看看,有哪些适合内存特征的算法和存储机制,可以进一步提升内存数据库计算速度。我们知道,内存可以通过地址(指针)来访问原创 2022-07-06 09:39:06 · 12508 阅读 · 63 评论 -
深度长文探讨Join运算的简化和提速
连接运算(JOIN)一直是SQL中的老大难问题。在关联表稍多一点的时候,代码书写就变得很容易出错了。而且因为JOIN语句的复杂,导致关联查询也一向是BI软件的软肋,几乎没有BI软件能让业务用户顺畅地完成多表关联查询。对于性能优化也是,关联表较多或者数据量大时,JOIN的性能也很难得到提升。本文将对JOIN运算进行深入讨论,针对性地提出语法简化和性能优化的方法。我们先来看SQL是如何理解JOIN运算的。SQL对JOIN的定义非常简单,就是两个集合(表)做笛卡尔积后再按某种条件过滤,写出来的语法就是A JOIN原创 2022-06-30 09:54:46 · 9504 阅读 · 26 评论 -
DCM: 中间件家族迎来新成员
DCM是什么现代应用无时无刻不在与数据打交道,数据计算无处不在,报表统计、数据分析、业务处理不一而足。当前数据处理的主要手段仍然是以关系数据库为代表的相关技术,虽然使用高级语言(如Java)硬编码也能实现各类计算,但远不如数据库(SQL)方便,数据库在当代数据处理中仍然发挥举足轻重的作用。不过,随着信息技术的发展,存储与计算分离、微服务、前置计算、边缘计算等架构与概念的兴起,过于沉重、封闭的数据库在应对这些场景时越来越显得捉襟见肘。数据库要求数据入库才能计算,但面对丰富的多样数据源时,数据入库不仅效率低原创 2022-05-23 08:30:00 · 8903 阅读 · 63 评论 -
JAVA结构化处理开源库SPL
现代Java应用架构越来越强调数据存储和处理分离,以获得更好的可维护性、可扩展性以及可移植性,比如火热的微服务就是一种典型。这种架构通常要求业务逻辑要在Java程序中实现,而不是像传统应用架构中放在数据库中。应用中的业务逻辑大都会涉及结构化数据处理。数据库(SQL)中对这类任务有较丰富的支持,可以相对简易地实现业务逻辑。但Java却一直缺乏这类基础支持,导致用Java实现业务逻辑非常繁琐低效。结果,虽然架构上有各种优势,但开发效率却反而大幅下降了。如果我们在Java中也提供有一套完整的结构化数据处理和计原创 2022-05-11 08:30:00 · 17258 阅读 · 92 评论