
Hive
zerone-f
这个作者很懒,什么都没留下…
展开
-
Hive分析搜索引擎的数据
最近学习Hive的基本使用,下面就记录一下我学习Hive的一些基本语句数据格式:(数据可以点击:用户查询日志(SogouQ)下载搜狗实验室的数据,可以根据自己的需要选择数据规模)00:00:00 2982199073774412 [360安全卫士] 8 3 download.it.com.cn/softweb/software/firewall/antiviru...原创 2018-10-13 11:47:23 · 1747 阅读 · 0 评论 -
Hive分析电商数据
最近学习Hive的基本使用,下面就记录一下我学习Hive的一些基本语句数据可以到这里下载:链接: https://pan.baidu.com/s/1RAoicaE7uygtUpdwE-ACtg 提取码: ysrm数据格式:tbDate.txt2003-1-1,200301,2003,1,1,3,1,1,1,12003-1-2,200301,2003,1,2,4,1,1,1,1...原创 2018-10-13 16:00:33 · 3807 阅读 · 3 评论 -
解决Hive的Establishing SSL connection without server's identity verification is not recommended问题
问题描述:hive> Sat Oct 13 15:36:32 CST 2018 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SS...原创 2018-10-13 16:15:45 · 2454 阅读 · 0 评论 -
Hive基础
一、Hive的历史价值 1.Hive是Hadoop上的Killer Application,Hive是hadoop上的数据仓库,Hive同时 兼具有数据仓库的存储引擎和查询引擎的作用,而SparkSQL是一个更加出色和高级的查询引擎,所以现在在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。 2.Hive是Facebook退出,主要是为了让不懂Ja...原创 2018-10-10 21:27:15 · 210 阅读 · 0 评论 -
第55课:60分钟内从零起步驾驭Hive实战学习笔记
内容: Hive本质解析 Hive安装实战 使用Hive操作搜索引擎数据实战SparkSQL前身是Shark,Shark强烈依赖于Hive。Spark原来没有做SQL多维度数据查询工具,后来开发了Shark,Shark依赖于Hive的解释引擎,部分在Spark中运行,还有一部分在Hadoop中运行。所以讲SparkSQL必须讲Hive。一、Hive...原创 2018-10-26 22:06:44 · 547 阅读 · 0 评论 -
第56课:揭秘Spark SQL和DataFrame的本质
一、SparkSQL与DataFrame SparkSQL之所以是除了Spark Core以外最大和最受关注的组件,原因是: a)处理一切存储介质和各种格式的数据(同时可以方便的扩展SparkSQL的功能来支持更多类型的数据,例如Kudu); b)SparkSQL把数据仓库的计算能力推向了新的高度,不仅是无敌的计算速度(SparkSQL比Shark快了至少一个数量级,而Shar...原创 2018-10-26 22:14:37 · 231 阅读 · 0 评论 -
第74课:Hive on Spark大揭秘 完整版
内容: 1.Hive On Spark内幕 2.Hive on Spark实战一、Hive On Spark内幕 1.Hive on spark 是hive 的一个子项目,它是指不通过mapReduce 作为唯一的查询引擎,而是将spark 作为底层的查询引擎。hive on spark 只适用于hive 在可预见的未来,很有可能Hive默认的底层引擎就从MapR...原创 2018-11-11 19:53:09 · 673 阅读 · 0 评论 -
第79课:Spark SQL基于网站Log的综合案例综合代码和实际运行测试
内容: 1.热门论坛板块排名 2.综合代码实战和测试一、热门论坛板块排版创建表: spark.sql("createtable userlogs(date string, timestamp bigint, userID bigint, pageID bigint, channel string, action string) ROW FORMAT DELIMI...原创 2018-11-18 21:56:40 · 203 阅读 · 0 评论 -
127.Spark大型电商项目-Spark Streaming+Kafka调试之Hive在spark2.0.0启动时无法访问spark-assembly-*.jar的解决办法
目录1、问题描述2、解决方法:3、最后验证下转载地址:https://blog.csdn.net/wjqwinn/article/details/526923081、问题描述 自从spark2.0.0发布之后,每次启动hive的时候,总会发现一个小问题,启动hive --service metastore的时候,会报一个小BUG: 无法访问<PathTo...原创 2019-05-13 16:34:05 · 344 阅读 · 0 评论