1、Holo直查maxcompute的限制
1)单查询限制200G
2)分区数限制512
解决办法:将maxcompute的数据导入holo作为内表使用
2、Holo在即系查询场景的使用
通过flink将数据实时清洗到holo中,做一张增量更新的实时表,然后使用holo直查(结合报表工具来具体使用)
如果需要维度信息,可以通过建立maxcompute外表的方式,做到同时将maxcompute外表+holo内表的联合查询,也就是对接多数据源的联合查询
3、如何实现将离线数据定时写入到holo
这个目前要结合dateworks的调度功能来使用,在D2中的holo集成模块写SQL,然后将任务做周期性的调度即可
4、Holo因为内存达到限制导致查询失败
可以使用参数来解除限制:set hg_experimental_query_memory_in_MB_limit=0
当然最重要的还是提前对SQL就行优化,减少不必要的数据
5、Holo行转列的实现
SELECT regexp_split_to_table('a,s,d,f,g',',');