![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
机器熊技术大杂烩
欢迎访问机器熊的技术大杂烩,专注Java技术。
展开
-
数据分析案例1:Zeppelin+Hive分析MovieLens电影数据集
本文使用Zeppelin和Hive对MovieLens电影数据集进行分析,包括电影流行度分析、口碑分析等。Zeppelin连接Hive请参考:Zeppelin组件配置和使用:使用JDBC连接HiveMovieLens数据集介绍请参考:MovieLens数据集(电影推荐、Hive、Spark SQL)数据集介绍本文选择MovieLens小数据集ml-1m包含100万评分数据集,下载地址...原创 2019-04-28 20:15:19 · 4272 阅读 · 0 评论 -
Hive系列文章转载:基础、原理和应用
数据仓库(Data Warehouse)是一个面 向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史 变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。——比尔·恩门(Bill Inmon,数据仓库之父),1991 ,Building the Data Wa...原创 2019-04-29 11:14:08 · 239 阅读 · 0 评论