- 博客(322)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 Apache Doris 内部数据裁剪与过滤机制的实现原理
在分析型数据库的性能比拼中,**“少做事” 往往比 “快做事” 更关键** —— 数据读取过程中的磁盘 IO、网络传输(尤其存算分离场景)是资源消耗的核心,而**数据裁剪**正是通过 “跳过不需要处理的数据”,从根源降低开销。
2025-09-30 18:41:57
964
原创 深入解析 Apache Doris 写入原理:一条数据的“落地之旅”
在日常的数据分析场景中,我们经常会向 Apache Doris 写入大量数据,无论是实时导入、批量导入,还是通过流式写入。但你是否想过:一条数据从客户端发出,到最终稳定落盘,中间到底经历了哪些步骤?
2025-09-17 00:13:51
1016
原创 Apache Doris 3.1 重磅发布:半结构化与湖仓一体的飞跃升级
Apache Doris 3.1 版本正式发布啦,这一版本堪称是 Doris 发展历程中的又一里程碑,为广大用户带来了众多令人惊喜的新特性与优化,赶紧跟着我们一起来先睹为快!
2025-09-10 18:43:52
715
原创 Apache Doris 数据存储架构深度解析:从逻辑模型到物理实现的全方位剖析
本文深入解析Apache Doris的存储架构设计,重点介绍了其数据组织、文件格式、写入与压缩机制以及读取优化策略。
2025-09-04 03:06:02
988
原创 遥遥领先!Apache Doris 实时分析性能刷新行业天花板
实时分析领域标杆测试 RTABench 最新榜单揭晓 ——**Apache Doris 以绝对优势登顶**,其性能是 ClickHouse 的 6 倍、PostgreSQL 的 30 倍、MongoDB 的 100 倍,用数据重新定义了实时分析数据库的性能上限。
2025-08-27 16:39:38
1011
原创 波司登 × 阿里云 SelectDB:存算分离架构如何让羽绒服巨头降本 30%、性能翻 5 倍?
过去,多引擎并存的旧架构让数据冗余、性能卡顿、成本高企成为难题;如今,基于阿里云 SelectDB 的存算分离升级,不仅实现了 2-5 倍性能跃升,更让总体成本降低 30% 以上,为传统企业数字化转型树立了标杆。
2025-08-25 20:54:48
1106
原创 菜鸟物流的 “数据引擎“:Apache Doris 从 0 到万核的规模化落地之路
从 2023 年的小范围验证到如今 25 + 集群、上万核规模的全面应用,Doris 在菜鸟完成了一次教科书级别的 OLAP 数据库规模化落地。今天,我们就来拆解这场历时两年的技术实践,看 Doris 如何成为菜鸟物流的 "数据引擎"。
2025-08-16 09:32:00
875
原创 从根源到生态:Apache Doris 与 StarRocks 的深度对比 —— 论开源基因与长期价值的优越性
在 OLAP 领域,Apache Doris 与 StarRocks 常被一同提及,两者有着深厚的技术渊源 ——StarRocks 源自 Apache Doris 的代码 Fork,却在后续发展中走向了不同的路径。本文将从代码根源、架构演进、社区生态、功能特性等多维度展开对比。
2025-08-14 23:25:48
2362
原创 深入理解 Doris Compaction:提升查询性能的幕后功臣
如果你好奇 Doris 如何在高频写入后仍能高效响应查询,或是想解决数据版本膨胀带来的性能问题,这篇关于 Compaction 的深度解析值得收藏 👇
2025-07-30 20:30:00
1926
5
原创 一文读懂 Doris 冷热分离,优化存储与查询性能
摘要:Doris的冷热分离技术通过智能存储策略有效解决大数据存储成本与查询性能的平衡问题。该功能基于存储资源管理,支持S3、AZURE、HDFS等多种存储介质,可根据时间策略自动将冷数据迁移至低成本存储。用户可通过创建存储策略(如设置冷却时间或TTL)实现数据分层,同时支持SSD/HDD分层存储。该技术特别适用于日志分析等时间敏感型业务场景,在保证热数据高效查询的同时显著降低存储成本,实现资源优化配置。
2025-07-25 20:00:00
1048
转载 浩瀚深度:从 ClickHouse 到 Doris, 支撑单表 13PB、534 万亿行的超大规模数据分析场景
摘要: 浩瀚深度企业级大数据平台采用Apache Doris替换ClickHouse,成功应对超大规模数据处理挑战。其最大集群部署于117节点,单表数据量突破13PB、534万亿行,日均导入145TB,峰值158TB,稳定运行半年。测试表明,Doris在前缀索引、二级索引场景下性能达ClickHouse的2-5倍,全表扫描表现接近。迁移通过调整写入组件和SQL适配实现平滑过渡,并针对大批量写入和Compaction压力问题优化,验证了Doris在PB级数据场景下的高可靠与高性能优势。
2025-07-18 13:53:29
561
原创 Doris BE 节点宕机?这篇指南助你快速定位与修复!
今天,我们就深入探讨 Doris 的 BE 宕机问题定位与解决方法,让你在面对宕机时更加游刃有余!
2025-07-09 21:30:00
1692
原创 Doris 数据导入性能优化全攻略:深度诊断与全面提速指南
本文将结合官方文档、实战经验以及关键优化策略,为大家提供一套完整且详细的Doris导入性能优化方案。
2025-07-03 21:00:00
1447
原创 Apache Doris Profile 深度解析:从获取到分析,解锁查询性能优化密码
当我们遇到查询缓慢、资源消耗异常等问题时,Doris 提供的 Profile 工具就如同一位 “性能侦探”,能帮我们抽丝剥茧,找到问题根源。今天,我们就来深入聊聊如何分析 Profile,让 Doris 的查询性能更上一层楼。
2025-06-30 20:00:00
1253
原创 大咖对谈:大数据算法求职与学习的核心秘籍
6位大厂数据工程师联合力扣官方推出算法面试指南,涵盖近百道高频母题与大厂真题。内容分为:基础数据结构(数组、树、图等)、核心算法(动态规划、分治等)、大数据专项(Top K、海量存储等),并附真实面试题解析与备考策略。6月24日将举办专场对谈,分享刷题技巧与面试经验。手册深度剖析题目底层逻辑,结合复杂度分析,助力高效攻克大数据算法面试。
2025-06-23 23:01:51
248
原创 深入剖析 Doris 倒排索引(下):常见问题解决方案大全
本篇将针对倒排索引常见问题,从写入性能到查询异常,提供全方位的解决方案,助你扫清使用障碍,充分发挥 Doris 倒排索引的强大效能。
2025-06-20 21:00:00
1526
原创 Doris Catalog 联邦分析查询性能优化:从排查到优化的完整指南
在大数据分析中,Doris 的 Catalog 联邦分析功能为整合多源数据提供了有力支持。然而,在实际应用中,可能会遇到各种问题影响其正常运行。本文将详细剖析这些问题并提供解决方案。
2025-06-05 00:24:18
1911
5
原创 深入剖析 Doris 倒排索引(上):原理与应用全解析
Apache Doris 的倒排索引功能,就像一把 “利刃”,为数据检索与分析效率的提升提供了强大支持。本文上篇将围绕 Doris 倒排索引的基础原理与功能特性展开,带你深入了解这一技术的核心要点。
2025-05-22 22:11:34
1168
原创 MySQL 迁移至 Doris 最佳实践方案
本文将深入剖析三种经过实践验证的 MySQL 迁移至 Doris 的最佳方案,涵盖全量迁移、增量同步、混合迁移以及基于 CDC(Change Data Capture)的实时迁移。
2025-05-15 23:09:38
2132
原创 Clickhouse 迁移到 Doris 的最佳实践
在将数据从 Clickhouse 迁移到 Apache Doris / SelectDB Cloud 的过程中,涉及表结构迁移、查询语句迁移以及数据迁移等多个关键环节。每个环节都有其复杂性和需要注意的细节,本文将详细介绍这些内容及对应的最佳实践方法。
2025-05-12 19:50:37
1256
原创 Hive 数据同步到 Doris 最佳实践方案:从场景适配到性能调优全解析
本文将围绕 Hive 数据同步到 Doris 的核心需求,从适用场景、技术方案、模型设计到性能优化展开全面解析。
2025-04-24 20:19:13
1985
原创 Doris 中 Compaction 问题的深度剖析与解决方案
本文将详细探讨一些常见的 Compaction 问题,包括 Compaction score 高、Compaction 失败、Compaction 占用资源多以及 Compaction 导致 BE core 等情况,并提供相应的排查思路和处理手段。
2025-04-14 21:13:14
1381
原创 Doris:打破 SQL 方言壁垒,构建统一数据查询生态
在大数据领域,不同的数据库系统往往使用不同的 SQL 方言。这就好比不同地区的人说着不同的语言,给数据分析师和开发人员带来极大的困扰。当企业需要整合多个数据源进行分析时,可能要花费大量时间和精力,在不同的 SQL 语法之间切换。然而,Apache Doris 凭借强大的 SQL 方言兼容能力,打破了这一壁垒,为用户构建了一个统一的数据查询生态。
2025-04-02 20:55:52
885
原创 Apache Doris 数据导入方案终极指南:原理、优化与问题排查
本文将彻底拆解 Stream Load、Broker Load、Routine Load、Insert into 四大核心方案,从原理解析到导入调优,从数据转换到故障排查,提供一站式解决方案。
2025-03-26 07:53:12
1253
原创 存算分离是否真的有必要?从架构之争到 Doris 实战解析
在数据库与大数据领域,“存算一体” 与 “存算分离” 的架构之争从未停歇。有人质疑:“存算分离真的有必要吗?本地盘性能难道不够?” 答案并非非黑即白 —— **技术选型的关键,在于业务场景与资源诉求的精准匹配**。
2025-03-21 20:30:00
2435
原创 Apache Doris 湖仓一体:打破数据边界,解锁实时分析的终极答案
湖仓一体架构融合数据仓库的高性能、强管理能力和数据湖的灵活性,底层支持多种数据类型并存与共享,上层通过统一接口,同时满足实时查询和分析,极大便利企业数据治理,成为大数据领域的发展新趋势。
2025-03-19 22:45:00
1037
原创 Doris vs Elasticsearch:全维度对比与实际成本案例解析
本文将从架构设计、数据导入、查询优化、存储管理、使用方式、运维难度、社区活跃度等多个角度进行对比,并重点加入使用成本的讨论,最后通过中信银行信用卡中心的实际案例,展示 Doris 替换 Elasticsearch 后的显著收益。
2025-03-14 20:00:00
1963
原创 Doris 数据划分:分区与分桶策略全解析
在 Doris 的分布式架构里,数据划分策略是实现高效存储和查询的关键所在。它主要依靠分区(Partition)和分桶(Bucket)这两层逻辑划分,对数据的分布进行精细化管理。
2025-03-13 20:30:00
1458
原创 Doris vs ClickHouse 企业级实时分析引擎怎么选?
本文将详细介绍 Doris 的优势,并通过直观对比展示两者的关键差异,同时分享一个企业成功用 Doris 替换 ClickHouse 的实践案例,帮助您做出明智的技术决策。
2025-03-07 22:16:30
1315
原创 Apache Doris 索引的全面剖析与使用指南
搞大数据开发的都知道,想要在海量数据里快速查数据,就像在星图里找一颗特定的星星,贼费劲。不过别慌,数据库索引就是咱们的 “定位神器”,能让查询效率直接起飞!就拿 Apache Doris 这个超火的分析型数据库来说,它支持好几种索引,每种都有自己的 “独门绝技”,能在不同查询场景下大显身手。今天就带大家好好研究下 Apache Doris 的索引,看看它到底是怎么做到这么牛的!
2025-02-25 20:30:00
1311
原创 Doris 查询优化秘籍(下篇):进阶优化技巧全解析
在上篇秘籍中,我们深入挖掘了 Doris 查询优化里 Schema 设计、索引优化以及分区裁剪优化扫表的关键策略,这些策略就像给 Doris 这位 “数据大侠” 配上了神兵利器,战斗力直线飙升。今天,咱们接着探索下篇,看看还有哪些进阶技巧,能让 Doris 在数据处理的战场上大杀四方,一路 “狂飙”。
2025-02-21 19:45:22
1589
原创 Doris 查询优化秘籍(上篇):关键优化策略剖析
在大数据开发的领域中,Apache Doris 凭借其强大的性能,成为处理海量数据的有力工具。若想让 Doris 在数据处理中发挥出最大效能,查询优化必不可少。本文作为 Doris 查询优化秘籍的上篇,将深入剖析 Schema、索引优化以及使用分区裁剪优化扫表的关键策略。
2025-02-17 21:07:50
1472
原创 Doris 磁盘问题全解析:从挂盘到 Trash 机制,一文读懂!
在使用 Apache Doris 时,磁盘相关的问题时有发生。今天,我们就来系统地梳理一下常见的 Doris 磁盘问题,以及对应的解决方案,帮助大家快速定位并处理问题!
2025-02-11 07:00:00
1471
原创 Doris 查询正确性问题排查指南
在使用 Apache Doris 的过程中,Unique Key 的正确性问题可能会对数据查询结果和存储一致性产生影响。本文将为大家详细解析这些问题的分类、排查步骤以及解决方案。希望通过这篇文章,让大家对 Unique Key 的正确性排查有一个清晰的认识。
2025-01-24 08:20:37
1650
原创 Doris 建表与分区问题全解析
在使用 Doris 进行表创建和分区操作时,用户可能会遇到各种错误情况。本文旨在深入剖析常见的创建表失败以及动态分区失败问题,并提供具有针对性的解决思路。
2025-01-23 14:23:01
1057
java实现简历管理系统的下载链接.txt
2021-05-06
jsp超市管理系统.zip
2021-12-30
Calculator.java
2020-02-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅