- 博客(311)
- 收藏
- 关注
原创 PostgreSQL + Apache Doris:构建用于实时分析的 HTAP 架构
像 PostgreSQL 和 MySQL 这样的 OLTP(在线事务处理)数据库,凭借其强一致性和高并发事务处理能力,已成为行业标准。为应对更大规模的工作负载,许多团队还会引入分库分表方案,将数据分布到多个实例和表中,以此突破单节点瓶颈。然而,这种对事务行之有效的方案,在实时分析需求(实时运营仪表盘、多维业务报告、用户行为分析和实时监控)面前却暴露出明显短板。问题的关键不在于将 PostgreSQL 数据库扩展到其设计范围之外的用途,而是在其旁构建一个专用的分析层。本文将介绍如何将 PostgreSQL 与
2026-03-18 14:32:40
455
原创 OLAP 无需事务?Apache Doris 如何让实时分析兼具事务保障
引言:Apache Doris 通过内置的轻量级强一致事务机制,解决了实时分析中数据重复与中间状态可见等挑战。支持 READ COMMITTED 隔离级别,通过 Label 机制确保数据不重不丢,并为复杂 ELT 提供原子性保障。Doris 打破了“OLAP 无需事务”的认知,是业界少数能同时实现实时、高性能与强一致性的分析引擎。传统观念中,事务往往与 OLTP(在线事务处理)系统紧密关联,而 OLAP(在线分析处理)系统更注重查询性能和数据吞吐量。
2026-03-16 15:41:07
390
原创 Apache Doris + SelectDB:定义 AI 时代,实时分析的三大范式
我们正处在一个数据与智能深度耦合的时代。。这正是我们今天强调实时分析的底层逻辑。它不再是加分项,而是企业在数字经济中生存与成功的必需品。
2026-03-16 15:40:16
542
原创 易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
导读:数据的爆发式增长与业务对实时性的极致追求,驱动易车技术团队在实时湖仓建设上持续探索。目前易车已基于 Apache Doris + Paimon + Hive 构建了湖仓一体化数据平台,实现架构收敛统一:**逐步替换 Druid、Kudu、HBase、MongoDB、ClickHouse 等近 10 种引擎。**广泛应用于实时多维分析、用户画像及标签体系、BI 报表(实时报表、仪表盘)等核心场景。在此基础上,团队进一步探索,为智能化业务提供实时、统一的数据底座。
2026-03-06 16:51:12
425
原创 我们用 AI Observe Stack 观测了 OpenClaw,发现 AI Agent 背后的这些隐患
是一个开源的 AI 可观测平台,专为 AI Agent 场景设计。组件职责遥测数据网关,接收 OpenTelemetry 协议数据存储层,VARIANT 类型 + 倒排索引,天然适配半结构化数据Grafana+ Doris App 插件可视化层,支持 SQL 查询和预置 Dashboard如果你正在运行 AI Agent,你需要回答一个问题:**你知道它在做什么吗?**它执行了哪些命令?访问了哪些文件?调用了哪些外部服务?花了多少 token?有没有被注入攻击?
2026-03-06 16:45:43
744
原创 实力认证!飞轮科技入选“2025北京软件核心竞争力企业(技术研发型)”
作为飞轮科技基于 Apache Doris 打造的现代化实时数据仓库,SelectDB 以实时、统一、弹性、开放为核心能力,为企业提供高性价比、简单易用、安全稳定、低成本的大规模数据实时分析。:不绑定特定云厂商,可在阿里云、华为云、AWS 等多个云平台上以 SaaS 模式部署,并支持 BYOC(自带云)模式,充分满足数据合规与成本控制需求。:可运行于裸金属服务器、虚拟机、K8S 之上,配套可视化开发与运维工具,实现一站式集群部署接管、开发和数据的交互式探索,深度赋能企业本地部署场景。
2026-03-04 12:10:57
194
原创 Doris & SelectDB for AI 实操:从零搭建非结构化数据智能分析洞察系统
Data + AI 能用在哪些场景?具体落地又该如何操作?本文借助 SelectDB + AI,搭建一个用于收集、整合与分析全域用户反馈的智能洞察系统。以此实战,给有需求的用户提供可参考的基础方法论。
2026-02-28 11:44:34
708
原创 SelectDB:定义 AI 时代的现代化数据基础设施
现代化基础设施已经经历了从分布式到云原生,再到湖仓架构的三个重要阶段。SelectDB 站在了进化的顶端,完美契合当下及未来的技术潮流。~2000 | 分布式时代(Distributed Era):线性扩展的起点采用架构,通过数据分片和分布式技术打破了单机性能极限。这一阶段实现了硬件资源的初步横向扩展(Scale-out)和高可用性,为海量数据处理奠定了物理基础。~2010 | 云原生时代(Cloud-Native Era):解耦与弹性的飞跃核心特征是。
2026-02-24 12:14:02
1020
原创 Apache Doris 4.0.3 版本正式发布
亲爱的社区小伙伴们,**Apache Doris 4.0.3 版本已正式发布。** 此版本新增了在 AI & Search、湖仓一体、查询引擎等方面的能力,并同步进行了多项优化改进及问题修复,欢迎下载体验!GitHub 下载:https://github.com/apache/doris/releases官网下载:https://doris.apache.org/download
2026-02-12 18:47:01
880
原创 日志成本降低 83%:云上 Elasticsearch 和 SelectDB 的基准测试及成本分析
在可观测性场景中,Elasticsearch 常受限于写入性能与高昂成本。在《可观测性方案怎么选?SelectDB vs Elasticsearch vs ClickHouse》一文中提到, 在云上日志服务中,SelectDB 相比 Elasticsearch 展现出明显的性能和成本优势。为进一步探索,本文通过基准测试对比二者表现,验证 SelectDB 在日志场景下性能与成本上的显著优势。
2026-02-12 18:04:15
922
原创 快手:从分散存储到统一分析,Apache Doris 在万亿规模广告场景的应用
面对日增 3 亿行、万亿规模存量广告数据,快手广告数据平台如何突破性能瓶颈、实现架构统一与体验跃升?快手引入 Apache Doris 替换 ClickHouse、Elasticsearch,从分散存储到统一分析,实现查询性能提升 20~90%,单表写入吞吐 300 万行/秒,存储效率提升 60%!
2026-02-02 12:29:22
790
原创 上市大模型企业数据基础设施的选择:MiniMax 基于阿里云 SelectDB 版,打造全球统一AI可观测中台
MiniMax 作为上市大模型企业,基于阿里云 SelectDB 打造 AI 可观测中台,实现“一个平台,全球覆盖”。这一成功实践足以表明:SelectDB 能够很好满足 AI 时代海量数据实时处理与分析的需求,为同样需求的 AI 大模型企业提供了一个高性能、低成本的可靠技术解决方案。
2026-01-27 11:47:29
652
原创 构建 AI 数据基座:思必驰基于 Apache Doris 的海量多模态数据集管理实践
导读:面对海量多模态数据管理困境,思必驰通过构建以 Apache Doris 为核心的数据集平台,实现了数据从 “散、乱、滞” 到 “统、明、畅” 的转变。在关键场景中,存储占用下降 80%、查询 QPS 提升至 3w,不仅实现可量化的效率提升和成本优化,更系统化地提升了 AI 研发效率与模型质量。本文整理自 思必驰数据中台架构师魏凯君在 Doris Summit 2025 中的演讲内容,并以演讲者第一视角进行叙述。
2026-01-23 16:12:05
734
原创 AI 能力揭秘(五):Apache Doris 原生向量检索的设计及实现
随着大模型和多模态 AI 的快速发展,向量已成为文本、图像、音视频等多元数据的通用语义表示。在这种背景下,检索增强生成(RAG)技术成为连接私有知识与大模型的核心桥梁,而高效的向量检索则是其关键支柱。与将向量检索视为独立外挂服务的方案不同,Apache Doris 4.0 选择将向量检索能力深度集成于其 MPP 分析型数据库内核。实现向量检索与 SQL 计算、实时分析和事务保障的无缝融合。本文旨在深入剖析 Doris 向量检索的系统级设计与工程实践,展示其如何在性能、易用性与规模扩展之间取得的平衡。
2026-01-21 17:27:55
757
原创 驾驭 CPU 与编译器:Apache Doris 实现极致性能的底层逻辑
Apache Doris 的演进给我们提供了一个生动的答案——它不仅跟随硬件与编译器的发展而演进,更主动地通过向量化、模板化、指令级并行与精细的用户态调度模式,将每一代 CPU 的潜力推向理论极限。
2026-01-13 20:49:07
774
原创 从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验
面对日益增长的业务体量与复杂多变的分析需求,选用一个高效、可靠的数据库系统,已成为支撑业务稳健发展与快速创新的关键。Apache Doris 以其出色的性能表现与高度灵活的架构,成为众多场景下的优选方案。
2026-01-12 17:32:31
658
原创 5 倍性能提升,Apache Doris TopN 全局优化详解|Deep Dive
为了帮助用户快速获取目标数据,Apache Doris 针对 TopN 类型查询进行了全局优化,可将此类查询的性能提升约 5 倍;同时,优化范围也从单表进一步拓展至数据湖场景与多表关联查询,显著扩大了适用范围。
2025-12-30 22:01:03
944
原创 Doris Catalog 已上线!性能提升 200x,全面优于 JDBC Catalog,跨集群查询迈入高性能分析时代
Apache Doris 4.0.2 版本推出重磅特性:Doris Catalog。该功能专为跨 Doris 集群联邦分析设计,支持通过 Arrow Flight 和虚拟集群两种模式,进行更高效、更贴合原生优化的跨集群查询。
2025-12-26 21:39:29
650
原创 慢 SQL 诊断准确率 99.99%,天翼云基于 Apache Doris MCP 的 AI 智能运维实践
Apache Doris 上的应用规模庞大,已在生产环境中落地超 30 个项目,覆盖广泛的业务场景,展现出大规模、多类型场景并行运行的特征。
2025-12-24 12:01:57
793
原创 Apache Doris 4.0.2 版本正式发布
亲爱的社区小伙伴们,**Apache Doris 4.0.2 版本已正式发布。**此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!
2025-12-22 16:22:09
1062
原创 Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索与分析架构全解
AI 时代正在重塑数据库的角色。过去,数据库主要为人类分析者提供报表与查询能力;而现在,越来越多的查询来自智能代理(Agent),它们会自动检索知识、过滤数据、组合多种信号,并将数据库作为 “实时信息源” 支撑推理与决策。
2025-12-18 17:10:59
1156
原创 较 Trino 省 67% 成本,速度快 10 倍,中通快递基于 SelectDB 的湖仓分析架构
中通快递基于 SelectDB 构建了湖仓分析架构,补齐 OLAP 分析能力。在离线场景中,实现 2000+ QPS 并发点查;在实时场景中,仅以 1/3 原集群机器数量覆盖所有业务,90% 分析任务从 10 分钟缩短至 1 分钟内,投入产出比大幅提升。
2025-12-17 09:33:57
977
原创 面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse
摘要: AI时代对数据仓库提出更高要求,需支持高并发、低延迟查询以满足智能体分析需求。Apache Doris 4.0凭借多项优化技术(数据裁剪、Pipeline执行引擎、向量化处理)在SSB-FLAT、SSB和TPC-H基准测试中表现卓越,查询吞吐量(QPS)显著领先Snowflake和ClickHouse,最高达7.39倍。其能力源于高效的数据过滤、并行执行架构及SIMD加速,成为AI时代理想的实时分析中枢,为智能决策提供稳定支撑。
2025-12-12 12:46:31
1136
原创 浙江头部城商行:每日 700 万查询、秒级响应,Apache Doris 查算分离架构破局资源冲突
在当前银行业务全面线上化、实时化的驱动下,浙江省头部城商行亟需构建一个能够同时承载海量数据加工与高并发实时查询的数据平台,以支撑精准营销、实时风控和智能决策等关键业务。
2025-12-11 19:37:48
821
原创 Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive
本文档将作为一份官方指南,系统性地阐述 Apache Doris 的数据更新能力,内容涵盖其核心原理、多样的更新与删除方式、典型的应用场景,以及在不同部署模式下的性能最佳实践,旨在帮助您全面掌握并高效利用 Doris 的数据更新功能。
2025-12-04 16:36:38
1250
原创 云上数据安全新范式:Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据
1、Doris 通过将 FE、BE 进程所部署的 AWS EC2 Instances 绑定到 Source Account ,利用 AWS IAM 的 Assume Role 功能获取跨账户访问权限,从而安全地访问目标账户中的 AWS 资源。■ 目标角色使用临时凭证访问 AWS S3 前,目标账户的 IAM 策略引擎校验:该角色是否被授权执行请求的 S3 操作?■ 源用户发起 AssumeRole 请求时,源账户的 IAM 策略引擎首先验证:该用户是否被授权调用 sts:AssumeRole 操作?
2025-12-03 11:32:20
536
原创 Apache Doris 在小米统一 OLAP 和湖仓一体的实践
本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
2025-12-02 15:48:08
1151
原创 宇信科技基于 SelectDB & Apache Doris 构建实时智能的银行经营分析平台
深耕银行 IT 建设领域 26 的年, 宇信科技服务超数百家金融机构,覆盖核心系统、渠道平台、风控中台等关键业务场景。其数据条线团队专注经营分析场景 20 余年,为城商行、农商行提供从报表系统到智能决策的全栈解决方案。随着银行业数字化进程步入深水区,宇信科技面临双重挑战:一方面,市场节奏的加快,让客户对“分钟级数据响应”需求迫切,传统数据平台的处理效率与扩展能力已显滞后;另一方面,决策者不再满足于“工具即报表”现状,需要一种能够实现 “智能归因-闭环决策” 的深度分析能力,以应对复杂多变的市场环境。
2025-11-28 12:14:19
398
原创 上海证券 SelectDB 升级实践:湖仓流批一体落地与 Elasticsearch 全面替换
上海证券引入 SelectDB 作为核心实时分析引擎,有效弥补了实时数据处理与分析的能力短板,实现湖仓一体与流批一体,同时替换了原架构中的 Elasticsearch 组件。达成了写入性能提升 4 倍,支撑 1000+ QPS 高并发访问,关键决策响应速度 200 ms,开发效率提升 50%,运维成本大幅降低的关键收益。
2025-11-28 11:38:01
324
原创 字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践
随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:能否构建一款「AI + Data」一站式融合的数据引擎? 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处理与 AI 模型无缝衔接,并能确保数据处理负载与在线服务负载完全隔离。这是 2024 年末启动 DataMind 项目的初衷。
2025-11-27 16:15:26
1132
原创 Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器
在数据库系统的核心层,查询优化器如同一位精明的策略家,不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库,其优化器内置的 Data Trait 分析机制,通过挖掘数据内在的统计特征和语义约束,为查询优化提供了基础设施。让我们一起来探索这个强大的功能!
2025-11-27 11:07:53
642
原创 更高效的数据处理解决方案:基于 MinIO 部署 Apache Doris 存算分离版本实践
Apache Doris 作为一款具备高性能的实时分析数据库,拥有湖仓一体的能力。当它与 MinIO 这样高性能且 S3 兼容的对象存储系统相结合时,能够构建出一个高效且具备低成本特性的数据分析系统。本文将介绍基于 Apache Doris 和 MinIO 的存算分离部署教程与使用实践。
2025-11-27 09:06:37
987
原创 压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive
在分析型数据库中,列式存储是压缩和查询性能的核心基础。它按列组织数据,同一列值类型一致且分布相似,为编码与压缩算法提供极高空间局部性和可预测性。当存储的值变化较小或重复频繁时,列式布局能够减少冗余存储,并提升向量化扫描的 CPU 效率。Apache Doris 作为一款典型的列式存储引擎,可独立存储每一列数据。导入时,每列数据写入近似固定大小的数据页,经过编码和压缩处理,以实现更紧凑的存储。在 Doris 中,数据的压缩和解压均以数据页为单位,压缩算法的上下文限制在单个数据页内。因此,在接下来的章节中,
2025-11-25 15:21:24
1092
原创 【深入理解 Doris Variant:如何让 JSON 查询性能追平列存,还能承载万列索引字段?|Deep Dive】
在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中,对于 JSON 的处理往往面临灵活性及性能无法兼得的困境,而 Apache Doris 的 VARIANT 类型,通过动态子列、稀疏列存储、延迟物化和路径索引等能力,实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解,全面展示其优势。
2025-11-24 18:44:41
1138
原创 公开免费!Apache Doris & SelectDB 培训与认证课程正式上线
随着 Apache Doris 用户群体日益壮大,许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手,还是希望在特定场景下深度应用的用户,都渴望一套从 0 到 1、全面覆盖的学习路径。这套体系旨在为所有 Doris 用户提供完整的学习课程与实践路径,帮助用户从理论到实践,逐步成长为实时分析型数据库专家。掌握 Doris 的安装与部署,快速搭建你的第一个 Doris 环境。同时,我们也免费提供了与课程配套的认证考试 ——的初级课程与认证,所有课程将。
2025-11-19 20:24:00
327
原创 Doris MCP Server v0.6.0 正式发布
多租户 SaaS(customer_a_token → database_a 完全隔离)、高可用环境零停机配置更新、安全敏感组织的企业级权限管控。🚀 Doris MCP Server v0.6.0,开启企业级数据平台与认证管理新时代!本次升级完全向后兼容 v0.5.x,现有 API 和配置无需修改,可平滑升级。Doris MCP Server v0.6.0 正式发布!
2025-11-18 21:13:18
313
原创 Apache Doris 数据导入原理与性能优化 | Deep Dive
对于 Apache Doris 这样的高性能分析型数据库而言,高效、稳定的数据导入是保障实时分析能力的生命线。然而,在海量数据持续写入的场景下,如何平衡导入延迟与吞吐、如何避免性能瓶颈,是开发者面临的核心挑战。Apache Doris 本文将深入剖析 Doris 数据导入的核心原理,涵盖关键流程、组件、事务管理等,探讨影响导入性能的因素,并提供实用的优化方法和最佳实践,有助于用户选择合适的导入策略,优化导入性能。
2025-11-18 20:55:25
743
原创 Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析
借助AI_AGG与EMBED函数,Apache Doris 拥有了了强大的智能分析能力,极大地拓展了数据分析与智能应用的边界。AI_AGG通过其动态预聚合机制,将非结构化文本的智能聚合分析带入数据库,轻松应对海量用户评论、日志分析等场景。而EMBED函数则与 Doris 的向量函数无缝集成,提供从文本到语义向量、再到相似度检索的一站式解决方案,极大简化了问答系统、内容推荐等应用的开发。
2025-11-18 18:58:44
1022
原创 Apache Doris 自动分区:如何应对分布式环境下的复杂并发挑战|Deep Dive
在解决了自动分区各个维度的并发挑战后,我们有必要跳出具体实现,审视其中蕴含的更具普适性的设计哲学与并发范式。这些范式不仅适用于 Doris,也对其他分布式系统的并发设计具有参考价值。
2025-11-16 14:04:17
1027
原创 替换 ClickHouse,查询并发提升 7 倍,高途教育基于阿里云 SelectDB 构建秒级实时报表
在续班场景,高途教育通过续班大屏实时整合全国区域及课程品类的续班数据,为管理层与一线人员提供实时、动态的续班数据洞察,以驱动资源精准调配与潜力课程识别。在行课场景,高途教育需将数据分析大屏嵌入至教师、运营、管理者等多角色工作台,为每个角色实时提供高度定制化的行课数据视图,支撑教学质量和全流程优化。
2025-11-12 20:08:47
925
《SelectDB 新一代日志存储与分析解决方案白皮书》
2024-06-19
Apache Doris 用户案例集
2023-06-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅