Power BI 的大数据处理方案:聚合

本文介绍了Power BI的聚合功能,一种处理大型数据集的解决方案。通过聚合,Power BI能够结合import和DirectQuery模式,解决内存限制和查询效率问题,提升大数据查询性能。文章详细阐述了聚合的原理、实践操作步骤,并通过测试验证了其显著的性能提升效果。
摘要由CSDN通过智能技术生成

前奏

说起Power BI中的聚合,也许大多数人第一反应是DAX或M中的聚合函数,而本文所讲的聚合,是一项发布一年多而鲜有人知晓,百度几乎查不到资料,却应用了微软Power BI团队最酷的技术,并能够使PowerBI成为解锁PB级或是Hadoop规模等大型数据集的利器!

(下图:Power BI Desktop中的"管理聚合")
在这里插入图片描述

痛点

过去,Power BI以其强大的功能性,可视化交互能力,拖拽式设计的易用性,紧锣密鼓的更新以及活跃的社区,成为全球最受欢迎的敏捷BI开发工具之一,然而,对于处理企业级大型数据集显然是Power BI的天然短板。为何这么说呢?

PowerBI的内核基于Analysis Services表格模型(TOM),利用AS表格模型中公式引擎(FE)和存储引擎(SE)的配合完成报表前端与后端模型的数据交互,通常来讲,存储引擎依据应用了筛选并经VertiPaq压缩过的缓存数据,能够以多线程的方式计算并迅速返回结果,这本身是十分高效的一个过程,但尽管表格模型拥有比多维数据集(cube)更强的数据压缩率,当数据体量达到TB甚至PB级时,内存很可能无法撑住这个体量,这会导致数据集中的分页大幅增多,从而严重拖慢查询性能(Power BI内置表格模型默认以800万行为单位进行分页,不过拥有Premium License的用户可以通过XMLA终结点修改这一数值,但这又是另一个话

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DAVIS-BI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值