数据分析
文章平均质量分 86
james二次元
分享大数据及AI相关技术,每天进步一点点,和大家一起学习、一起进步!
展开
-
OLAP引擎之Druid
Apache Druid 是一个开源的、分布式的实时分析数据库,专为大规模数据的快速查询和实时分析而设计。Druid 将数据存储、索引和查询处理功能结合在一起,支持对流数据和批量数据进行快速的、低延迟的分析查询。它特别适用于需要高并发、低延迟查询的场景,如实时数据分析、监控、在线广告分析等。原创 2024-08-20 05:00:00 · 1045 阅读 · 0 评论 -
分布式SQL查询引擎之ByConity
ByConity 是字节跳动面向现代数据栈的一款开源数仓系统,应用了大量数据库成熟技术,如列存引擎,MPP 执行,智能查询优化,向量化执行,Codegen,indexing,数据压缩,适合用于 Online Analytical Processing(OLAP) 场景和轻载数仓的场景,包括但不限于交互式分析、实时 APP 监控、流数据处理和分析等。原创 2024-07-31 06:30:00 · 609 阅读 · 0 评论 -
数据分析之帕累托分析
帕累托分析也称为帕累托法则或80/20法则,是一种优化管理方法,强调在原因和结果、投入和产出、努力和报酬之间存在的不平衡关系。这种方法认为,大约20%的原因或努力通常会导致80%的结果或成就。帕累托分析的主要目的是帮助决策者识别出那些关键的少数因素,以便优化资源配置和提升效率。原创 2024-07-26 07:30:00 · 764 阅读 · 0 评论