hive
文章平均质量分 77
reylee911
这个作者很懒,什么都没留下…
展开
-
基于mysql的hive表项存储实例分析
Hive存储是基于hadoop hdfs文件系统的,通过默认内嵌的Derby 数据库或外部数据库系统(如mysql)组织元数据访问,下面就通过实际案例描述其存储过程。 1, 在hive 中创建表,然后把外部csv文件导入其中(外部文件为Batting.csv, 内部表为temp_batting):hive>create table temp_batting (col_value STR原创 2015-05-27 20:30:51 · 538 阅读 · 0 评论 -
Hive数据挖掘实战教程
Hive 提供类SQL接口处理HDFS上数据,同时提供基于hadoop数据库访问,从而降低程序员的工作强度,省去了map/reduce的编程时间,为快速大数据分析提供了很好手段,下面是基于Hive数据分析一个实例。1, 环境配置:Hadoop 2.6 + hive + mysql (linux)搭建步骤可参考相关文档,此处略去。2, 数据源文件获取(仅作参考):http原创 2015-05-27 21:27:50 · 3551 阅读 · 0 评论 -
spark与hadoop集成详解
我们经常被问到如何让spark集成到hadoop生态系统中,如何让spark在现有的hadoop集群中运行,本文的目的就是来回答上述问题。1,spark主要用于提高而不是取代hadoop栈,从一开始spark就被设计从hdfs中读取存储数据,类似于其他的存储系统,例如Hbase, Amazon S3等,因此,hadoop用户可以通过结合spark来提高hadoop MR, Hbase 及其他大翻译 2015-06-03 15:08:02 · 5296 阅读 · 1 评论 -
Hive2.1.0安装配置mysql
1. 设置Hive环境变量export JAVA_HOME=/usr/java/jdk1.8.0_111export JRE_HOME=/usr/java/jdk1.8.0_111/jreexport CLASSPATH=/usr/java/jdk1.8.0_111/libexport HADOOP_HOME=/root/cluster/opt/hadoop-2.6.0expo原创 2016-11-08 17:05:28 · 613 阅读 · 0 评论