![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
技术说
文章平均质量分 92
RisingWave 中文开源社区
RisingWave 是一款开源分布式 SQL 流数据库,致力于大幅降低流计算使用门槛与复杂度。RisingWave 已为全球超百家企业构建新一代流处理与分析平台。
展开
-
RisingWave 用户定义函数 (三):Python 外部函数
RisingWave 支持 Python 和 Java 语言的外部函数 UDF,外部函数的灵活性让用户可以在 UDF 中做几乎任何事情,本文将分享 RisingWave 外部函数的实现。原创 2024-08-01 16:02:31 · 739 阅读 · 0 评论 -
深入了解 RisingWave(三)性能相关的主要指标
RisingWave 作为一个领先的分布式架构 SQL 流式数据库,能简单、高效、可靠地处理流数据。本文列举了 RisingWave Grafana 看板上显示的一些重要指标,了解这些指标有助于诊断潜在问题。原创 2024-07-23 16:26:12 · 767 阅读 · 0 评论 -
流式数据库 |RisingWave 的架构、容错、数据持久化
RisingWave 是一个分布式架构的 SQL 流式数据库,能简单、高效、可靠地处理流数据。本文将为大家分享其架构、容错性和数据持久化。原创 2024-07-18 22:57:29 · 892 阅读 · 0 评论 -
流式数据库|RisingWave 关键概念、术语一览
RisingWave 是一个分布式架构的 SQL 流式数据库,能简单、高效、可靠地处理流数据。为方便大家了解和使用 RisingWave,本文整理了相关核心概念和术语,供参考。原创 2024-07-16 16:09:47 · 963 阅读 · 0 评论 -
RisingWave 用例:流式 ETL、实时分析、事件驱动应用
流式数据库 RisingWave 非常适用于流式 ETL、实时分析和事件驱动应用。本文将分析 RisingWave 如何支持这些场景,并给出具体案例。原创 2024-07-11 16:06:49 · 532 阅读 · 0 评论 -
用流式数据库解决「自动化检测服务器性能异常」难题
对 DevOps 团队来说,检测大量服务器的性能异常并尽快响应一直是个挑战,而流式系统在这种情况下很有帮助。本教程将分享如何使用 RisingWave 自动化地从系统性能指标流中检测异常。原创 2024-07-09 17:03:21 · 641 阅读 · 0 评论 -
流式数据库 RisingWave「Demo」:直播指标实时分析
直播是目前最为流行的娱乐形式之一,本教程将分享如何使用开源流式数据库 RisingWave 监控直播指标。我们为本教程设置了一个演示集群,以便大家可以轻松尝试。原创 2024-07-04 18:22:35 · 844 阅读 · 0 评论 -
流处理系统对比:RisingWave vs ksqlDB
本文将从架构、部署与可扩展性、Source 和 Sink、生态系统与开发者工具几个方面比较 ksqlDB 和 RisingWave 这两款领先的流处理系统。原创 2024-07-02 14:53:48 · 630 阅读 · 0 评论 -
流式数据库笔记|从 0 开始离线安装 RisingWave 集群
RisingWave 是一款开源的分布式流处理数据库,旨在帮助用户降低实时应用的开发成本。本文分为三个部分: 离线环境如何用 yum 安装软件,离线环境安装 k8s 安装 helm,离线环境安装 RisingWave,可以按需使用 ):原创 2024-06-28 14:46:37 · 624 阅读 · 0 评论 -
RisingWave 用户定义函数 (二): Rust x WebAssembly
Rust UDF 非常适合编写计算密集型逻辑,其通过编译到 WebAssembly 实现隔离性,同时保持高性能。在这篇文章中,我们将介绍 RisingWave Rust UDF 的设计与实现。原创 2024-06-27 16:20:42 · 659 阅读 · 0 评论 -
实践|用流式数据库 RisingWave 最大化停车场利用率
作为一个流式数据库,RisingWave 可以最大化停车场的利用率。本文中,我们将介绍使用 RisingWave 实时监控停车位利用情况的两个场景,并探讨如何优化 RisingWave 的性能。原创 2024-06-25 15:13:08 · 763 阅读 · 0 评论 -
走近数据变更捕获(CDC):定义、优势和用例
数据变更捕获(CDC)是一种捕捉数据变更的技术。它能实时监控数据源(如数据库、应用系统等)中数据的增、删、改等变化,并记录下这些变更信息。与传统批处理方式相比,CDC 实现了近乎实时的数据集成和同步,使企业能够随时掌握最新信息,从而基于数据做出及时决策。原创 2024-06-25 15:08:49 · 1033 阅读 · 0 评论 -
技术内幕|在流式数据库 RisingWave 中实现 Sink 与上游物化视图解耦
但同时,由于 RisingWave 中可以基于物化视图创建物化视图,类似的问题还可能出现在上下游的物化视图中,上游的物化视图会受下游的物化视图影响。因此,当下游的外部系统出现抖动时,Sink 可能会需要比较长的时间才能把 Barrier 之间的数据处理完,而因为上述的全局 Checkpoint 机制,物化视图会受到 Sink 影响,其数据需要等 Sink 将数据处理完后才能进行 Checkpoint ,甚至在下游外部系统不可用的时候,整个系统将会无法完成 Checkpoint ,进入不可用的状态。原创 2024-06-24 14:50:58 · 950 阅读 · 0 评论 -
“流处理引擎” RisingWave 的三种经典交互方式
作为流数据库,RisingWave 在大数据生态中通常扮演着流处理引擎的角色。它从各种数据源读取数据,并将其写入不同的目的地。在此过程中,RisingWave 清洗、转换和聚合数据,最终得出计算的结果。在这篇 blog 中,我们首先介绍与 RisingWave 交互的两种最常见的方法及其优缺点。然后,我们将引入一种专为 PostgreSQL 用户准备的与 RisingWave 交互的新形式。原创 2024-06-24 14:42:08 · 814 阅读 · 0 评论 -
使用 RisingWave 和 Redash 处理和可视化实时数据
本文中,通过简单几步,我们将 RisingWave 与 Redash 集成。Redash 提供了广泛功能创建高级可视化图表和综合看板,而 RisingWave 则提供了强大的数据处理、转换和分析能力。此外,RisingWave 还具备更多丰富的集成可选,您可以轻松将其连接到消息系统,从而构建一个完整的流处理管道。原创 2024-05-22 15:08:05 · 640 阅读 · 0 评论 -
RisingWave 用户定义函数 (一) :概览
用户定义函数(User Defined Function,以下简称 UDF)是数据系统中的常见功能。它允许用户使用各种语言定义自己的函数,作为内置函数的补充,以实现各种定制化执行逻辑。通过 UDF,我们可以将多个已有函数组合起来形成新函数,简化查询逻辑;也可以使用 Python 等语言编写代码,借用其它语言的生态,填补 SQL 语言和内置函数表达能力的不足;除了纯计算以外,我们还可以调用外部系统 API,将外部服务集成到统一的数据处理管线中。可以说,UDF 的存在极大提升了数据处理系统的灵活性和扩展性。原创 2024-05-16 17:07:31 · 900 阅读 · 0 评论 -
使用 WarpStream、RisingWave 和 Grafana 进行实时网站监控
本文介绍了能够整合 RisingWave、WarpStream 和 Grafana 的实时网站监控系统。整个系统的设置过程清楚简单,要监控每个指标,您只需要在 RisingWave 中创建一个物化视图并在 Grafana 中进行可视化。上文展示的分析仅作为示例,为您提供灵感。如果您的数据点已经准备就绪,并提供必要的数据,可以尝试更复杂的分析和转换逻辑。欢迎您的进一步探索,如有任何问题或需要帮助,请随时联系我们。原创 2024-05-16 17:04:29 · 719 阅读 · 0 评论 -
1.8 发布!新增 Iceberg Source 和 MongoDB CDC 连接器
过去要从 RisingWave 摄取 MongoDB 的 CDC 数据,需要设置一个包括 Debezium 连接器的管道(用于 MongoDB 跟踪数据库变更并将其记录到 Kafka Topic 中)和一个 Kafka 连接器(用于连接到 RisingWave)。上个月的 1.7 版本新增了对其他语言 UDF 的支持,本月的新版本则继续改进了 UDF 的功能。在确保 etcd 的向后兼容的同时, 此次更新将为您带来 PostgreSQL、MySQL 和 SQLite 的技术预览,作为元数据存储的新选项。原创 2024-04-10 12:21:39 · 817 阅读 · 0 评论 -
基于 RisingWave 和 ScyllaDB 构建事件驱动应用
RisingWave 可在事件发生时即时处理事件数据,其内置的 ScyllaDB 连接器可实时将处理后的数据导出到 ScyllaDB。设想一下电子商务中的个性化推荐场景,通过连接点击流和产品目录流,我们可以实时分析用户的偏好并提供个性化推荐。以上是一个简单的用例示范,除此之外,使用 RisingWave,您可以轻松地过滤、连接和转换流数据,轻松表达复杂的转换逻辑。结合 RisingWave 的流处理功能和 ScyllaDB 的高性能 NoSQL 数据库,可为构建事件驱动应用和数据管道提供有效的解决方案。原创 2024-04-10 12:16:35 · 2225 阅读 · 0 评论 -
使用 RisingWave、NATS JetStream 和 Superset 进行实时物联网监控
本文逐步介绍了如何利用 NATS JetStream、RisingWave 和 Superset 构建实时物联网监控解决方案。以上三个系统的设置过程简单省力,资源效率高且具有强大的可扩展性,是实时物联网应用的理想组合。通过三者的无缝集成,不到一小时即可创建一个实时物联网看板。简而言之,这展示了物联网设备背景下 NATS JetStream、RisingWave 和 Apache Superset 在工业流程中的无缝集成,并通过可视化和看板实现了实时分析和监控。原创 2024-04-03 11:21:08 · 769 阅读 · 0 评论 -
基于 RisingWave 和 ScyllaDB 构建事件驱动应用
在构建事件驱动应用时,人们面临着两大挑战:1)低延迟处理大量数据;2)实现流数据的实时摄取和转换。结合 RisingWave 的流处理功能和 ScyllaDB 的高性能 NoSQL 数据库,可为构建事件驱动应用和数据管道提供有效的解决方案。原创 2024-03-28 14:16:44 · 1789 阅读 · 0 评论 -
基于 RisingWave 和 Kafka 构建实时网络安全解决方案
本教程介绍了如何使用 RisingWave 和 Kafka 构建实时威胁检测系统。使用 RisingWave 和 Kafka 分别进行流处理和数据传输,可为实时威胁检测提供强大的基础设施。通过在 RisingWave 中创建物化视图,可以高效查询和分析流数据,而 Kafka 则确保了系统不同组件之间的可靠数据传输。如果有兴趣深入了解,可从该GitHub 仓库获取本教程的完整代码,查看所有必要的脚本和配置。原创 2024-03-19 17:20:28 · 585 阅读 · 0 评论 -
基于 RisingWave 和 StarRocks 的实时打宽及分析解决方案
RisingWave 采用存算分离架构,实现了高效的复杂查询、瞬时动态扩缩容以及快速故障恢复,并助力用户极大地简化流计算架构,轻松搭建稳定且高效的流计算应用。在实时性要求低的场景,用户可以基于 StarRocks 完成离线分析,而当实时性无法满足的时候,用户就可以基于 RisingWave 的大宽表开发物化视图。在实时打宽这一场景里,RisingWave 能够在较低的机器成本下,利用存算分离的能力,无需调优技巧,来支撑一个过去难以维护的 Join 链路。RisingWave 旨在提供的就是这样的能力。原创 2024-03-18 18:20:33 · 933 阅读 · 0 评论 -
一行代码极速部署:打造面向开发者的流计算平台
作者:Yingjun Wu 在2021年初,我创立了,目标是推广流计算技术的普及。在过去的三年中,我不断的向市场布道RisingWave,希望RisingWave能够在流计算这一市场中占有一席之地。经过坚持不懈的努力,如今,RisingWave已被数百家企业采用,这些企业遍布多个领域,包括一些世界顶尖的金融交易、制造业、安全、航空航天等行业的公司。为大型企业提供优质服务总是能够令人感到兴奋。然而,与此同时,我始终在思考一个问题:为什么总是大公司?为什么不是中小型企业或者个人?原创 2024-03-15 11:41:04 · 866 阅读 · 0 评论 -
使用 Debezium 和 RisingWave 对 MongoDB 进行持续分析
RisingWave 能够很好地解析由 Debezium 提取的 MongoDB 变更流。它的云原生存储使其可连接多个 MongoDB 集合,并创建可被其他服务使用的统一流。同时,RisingWave 支持 JSONB,可轻松处理 MongoDB 文档,为实时数据处理挑战提供了强大的解决方案。原创 2024-02-28 11:45:23 · 836 阅读 · 0 评论 -
RisingWave 中 Iceberg 连接器的重构与优化策略
RisingWave 对 Iceberg 的原生支持能为用户带来许多益处。通过集成 Iceberg v2 的高级功能,RisingWave 提高了效率和稳定性。这让 RisingWave 用户能够最大限度地发挥数据潜力,并从数据湖架构中提取有价值的见解。此次更新使用户能够充分利用 RisingWave 和 Iceberg 的优势,从而激发更多可能性。原创 2024-02-23 14:29:07 · 919 阅读 · 0 评论 -
基于 RisingWave、Instaclustr 和 Apache Superset 对维基百科实时监控
在这篇博文中,我们介绍了一种流处理解决方案,用于实时监控维基百科中不同贡献者对多篇文章的编辑情况。我们从维基百科 API 中提取数据,并将其传输到部署在 Instaclustr 云中的 Kafka Topic。然后,我们在 RisingWave 创建了 Source 以摄取 Kafka 数据,并创建物化视图进行处理分析。为了更具体直观地展示所得信息,我们又利用 Superset 的强大功能对结果进行可视化,生成各类图表和综合看板。至此,我们即可全面且动态地了解维基百科的编辑情况。原创 2024-02-20 19:05:44 · 899 阅读 · 0 评论 -
RisingWave 中文用户文档上线,阅读更高效!
为满足广大中文社区用户、开发者及流处理技术爱好者的需求,RisingWave 用户文档中文社区版今天上线了!中文版文档的推出,旨在为广大用户提供更便捷、高效的阅读体验,帮助大家深入理解并有效使用 RisingWave,发挥其更多的潜力。原创 2024-02-08 10:50:33 · 391 阅读 · 0 评论 -
流式 dbt:RisingWave 流计算的正确打开方式
dbt 是现代数据栈中的 Git,它原理简单易上手,但所提供的能力却覆盖了数据仓库构建流程的方方面面。随着实时数据仓库的普及,越来越多的用户开始青睐 dbt + RisingWave 的组合。RisingWave 降低了实时数据处理的门槛,而 dbt 则让数据团队的组织协作变得更加方便。原创 2024-02-06 13:35:04 · 837 阅读 · 0 评论 -
流数据库是否可以被认为是计算引擎+数据库组合?
RisingWave 采用存算分离架构,实现了高效的复杂查询、瞬时动态扩缩容以及快速故障恢复,并助力用户极大地简化流计算架构,轻松搭建稳定且高效的流计算应用。独立的数据库很显然不适合做内部状态存储,因为频繁跨系统数据访问会造成巨大开销,对流处理系统这类对延迟敏感的系统来说并不可取。想要模拟出层级物化视图,用户需要在流处理引擎与数据库之外,再引入如 Kafka 等消息队列,来实现物化视图与物化视图之间的消息传递;,用户使用多套系统的体验与使用一套系统的体验有相当大的差距。RisingWave中文开源社区。原创 2024-01-30 13:39:28 · 362 阅读 · 0 评论 -
RisingWave 物化视图使用场景:订单数据看板
而例子中用户输入的时间范围是任意的,我们不可能针对每个范围查询都创建一个物化视图,因此我们需要两个步骤:1. 将订单表按一定的可复用时间粒度进行预聚合,我们可以按分钟,小时或者天级别对订单表进行支付金额预聚合,并通过物化视图物化结果。而当天的实时支付金额查询也会变得非常简单,因为 RisingWave 的物化视图是实时更新的,所以我们直接对 orders_total_price_per_day 查询当天时间范围的数据即可获得实时数据。我们可以在分钟级别的物化视图之上,再聚合一个小时级别的维度。原创 2024-01-30 13:33:01 · 1847 阅读 · 0 评论 -
RisingWave 多流 Join 实现高效实时数据打宽
RisingWave 是一个云原生 SQL 流式数据库,并针对流处理 Join 做了大量状态管理、复用、以及性能优化。本文介绍了 RisingWave 的 Join 的使用场景,流处理 Join 的基本原理,以及 Join 状态的特点。同时介绍了如何使用 Watermark 来控制 Join 状态的大小。RisingWave 提供 Symmetric Hash Join、Interval Join、Temporal Join、Delta Join 等面向用户的 Join Features。原创 2024-01-26 17:01:09 · 920 阅读 · 0 评论 -
RisingWave 实现高效流处理 join
RisingWave对于查询的处理可以分为两大类,一类称为是Streaming Query,另外一类称为Batch Query。其中Batch Query对Join的处理方式和传统数据库的原理是一样的,处理的输入都是有界限的(bounded)数据集。而Streaming Query主要的表达形式是CREATE MATERIALIZED VIEW,Streaming Query的Join需要处理流上无界限(unbounded)的数据流。 流上Join的两个上游输入有任何数据变更都需要增量地计算出Join的变更原创 2024-01-10 21:09:28 · 902 阅读 · 0 评论 -
使用 Redpanda 和 RisingWave 来更快更简单地构建和维护实时应用
在本教程中,我们将 RisingWave 连接至 Redpanda 流,并进行了基本的广告性能分析。该用例有点简单,旨在提供启发而非提供完整案例。原创 2024-01-09 15:08:09 · 946 阅读 · 0 评论 -
当 AI 遇到流计算:如何在 RisingWave 的数据上训练 AI 模型
经由 RisingWave 处理的流数据在许多企业中具有非常高的分析价值。得益于 RisingWave 的存算分离架构,MindsDB 在 RisingWave 之上进行模型训练是可行且稳定的。同时,RisingWave 充分支持 PostgreSQL 接口,所以 MindsDB 能无缝地进行接入。随着实时流处理以及 AI/ML 两个领域各自释放其动能,相信未来 RisingWave 和 MindsDB 两者的结合会为数据工程团队带来更多的价值。往期推荐。原创 2024-01-09 13:02:09 · 920 阅读 · 0 评论 -
新手必看流数据库 RisingWave 入门教程来啦!
在这份教程中,我们将带你一步步学习 RisingWave 的基础知识,并引导你逐步进阶,成为RisingWave 的高级玩家。通过阅读本教程,我们希望读者能够上手尝试 RisingWave,掌握更多技能以应对实时数据处理中的各种挑战。原创 2023-11-20 11:26:28 · 265 阅读 · 1 评论 -
优化 RisingWave 中 LSM-Tree Iterator 的 rust 代码
rust 中的异步方法并不会立刻返回其返回值,而是根据具体实现方法的代码,返回一个实现 Future trait的匿名类型,最终通过对这个匿名类型调用其实现的 Future trait中的 poll 方法,获得最终的返回值。因此,我们可以看成在不同的 HummockIterator 的实现中,都有一个实现了 Future trait 的类型,作为 HummockIterator 的这个实现中关联类型。尽管动态分发为代码带来了便利,但是在多路归并这种 CPU 密集的场景中,动态分发将会带来不小的开销。原创 2024-01-08 16:08:37 · 743 阅读 · 0 评论 -
分分钟教你在阿里云 K8s 上部署 RisingWave
本文主要介绍如何在阿里云【容器服务 Kubernetes 版 ACK】上部署RisingWave集群。RisingWave 当前提供单机试玩模式,以及基于 K8s 的分布式部署模式,生产中我们只推荐后者。K8s 虽然上手门槛高,但只需按照本篇文章的步骤依次操作,你依然能轻松驾驭一个生产集群。原创 2023-10-30 16:27:17 · 187 阅读 · 1 评论 -
SQL 到底适不适合做流计算?
本文分享了 RisingWave Labs 创始人&CEO 吴英骏参加 Current 2023 后围绕 “SQL 到底适不适合流计算”进行的一系列思考,包括:SQL 的表达力、SQL 的受众、SQL 流处理的市场规模等等。原创 2023-10-24 23:25:02 · 74 阅读 · 0 评论 -
如何利用随机化的 SQL 测试来帮助检测错误
SQLSmith 是一个用于自动生成和测试 SQL 查询的工具,旨在通过生成随机的有效 SQL 查询并在目标数据库上执行这些查询来探索数据库系统的功能和限制。如果查询导致数据库崩溃,或者产生了意外的错误,那么我们就探查到了一个错误。原创 2023-07-31 14:49:03 · 125 阅读 · 1 评论