- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 Hive MR小文件优化、性能调优、大小数据量级执行优化
不仅如此Hive的SQL还可以通过用户定义的函数(UDF),用户定义的聚合(UDAF)和用户定义的表函数(UDTF)进行扩展。 (几个函数之间的区别) Hive中不仅可以使用逗号和制表符分隔值(CSV / TSV)文本文件,还可以使用Sequence File、RC、ORC、Parquet (知道这几种存储格式的区别), 当然Hive还可以通过用户来自定义自己的存储格式,基本上前面说的到的几种格式完全够了。 Hive旨在最大限度地提高可伸缩性(通过向Hadoop集群动态添加更多机器扩展),性能,
2019-02-27 17:31:26 1949 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人