Hive
zghgchao
java开发/大数据/云计算
展开
-
Hive产生背景及Hive是什么
Hive产生背景 Apache Hive数据仓库软件可以使用SQL方便地阅读、编写和管理分布在分布式存储中的大型数据集。结构可以投射到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。产生背景有以下几个方面:MapReduce编程的不便性HDFS上的文件缺少Schema(字段名,字段类型等)Hive是什么原创 2017-12-21 10:17:10 · 5739 阅读 · 0 评论 -
Hive基本使用
启动Hadoop:${HADOOP_HOME}/sbin/start-all.sh启动Hive:${HIVE_HOME}/bin/hive创建表:CREATE TABLE table_name [(col_name data_type [COMMENT col_comment])]create table hive_wordcount(原创 2017-12-21 14:04:09 · 1879 阅读 · 0 评论 -
SQLContext/HiveContext/SparkSession的使用(二)
在Spark中使用HiveContext:并不需要安装一个Hive,只需一个hive-site.xml即可。cp ${HIVE_HOME}/conf/hive-site.xml ${SPARK_HOME}/conf程序实现:import org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.sql.hive.H原创 2017-12-22 11:05:15 · 1006 阅读 · 0 评论 -
SparkSQL操作Hive表数据
启动Hadoop:./sbin/start-all.sh启动Spark-Shell:./bin/spark-shell --master local[2]scala> spark.sql("show tables").show+--------+---------+-----------+|database|tableName|isTemporary|+--------+--------原创 2017-12-24 10:06:18 · 3055 阅读 · 0 评论 -
Hive基础之Hive是什么以及使用场景
Hive是什么1)Hive由facebook开源,构建在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自定义的函数UDF来处理内置无法完成的复杂的分析工作;5)Hi转载 2018-01-03 13:17:55 · 16988 阅读 · 0 评论