Hive
文章平均质量分 87
bestcxx
向外思考,向上生长
展开
-
Hive vs Spark
先来看看二者在概念上的区别 https://zhuanlan.zhihu.com/p/79813444 再来看看二者在性能上的区别 https://zhuanlan.zhihu.com/p/79946516 结论 Hive是在Hadoop分布式文件系统上运行的开源分布式数据仓库数据库,用于查询和分析大数据。 Spark 是一个框架,需要具体的类似于 Hive 的数据库支持,Spark 基于内存分析,速度更快。 ...原创 2020-05-12 23:34:41 · 329 阅读 · 0 评论 -
Hive 使用积累
文章目录批量处理 json 批量处理 json select log.字段2, 新表名.json内部字段1,新表名.json内部字段2 as sendSum from log.表名 log lateral view json_tuple(log.json字段属性,'json内部字段1','json内部字段2') 新表名 as json内部字段1,json内部字段2 where dt='202.........原创 2020-05-13 15:49:57 · 227 阅读 · 1 评论