- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 presto sql优化
distinct 与approx_distinctdistinct这种操作会把所有计算集中在一个节点上,速度慢可想而知;如果不是精准计算的话可以考虑使用approx_distinct(x)代替count(distinct x),速度大概能够提升3倍左右,但缺点是approx_distinct有2-3%的误差(官方,有次数据测试误差达到6-7%,这个还和数据整体分布有关),如果没办法接受这个误差,...
2019-08-14 16:33:22 2713
原创 presto on yarn生产实践
presto on yarn方案缺点hadoop集群的jdk版本过低无法满足prestoserver需求配置文件不易维护,特别是如果涉及多个hadoop集群,这点在大公司很常见hadoop集群单独团队维护,自己没有权限创建目录之类的,这个也很常见指定coordinator节点需要使用yarn label,否则每次重启都得找coordinator节点针对上述问题,解决方案如下:hado...
2019-08-07 15:35:20 1924
FastDFS安装文档以及测试类,redis单点故障解决方案之keepalived
2013-05-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人