大数据
文章平均质量分 83
君之见
改变,从学习开始。
展开
-
初识Hadoop
Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 随后在2003年Google发表了一篇技术学术论文谷歌文件系统(GFS)。GFS也就是google File System,google公司为了存储海量搜索数据而设计的专转载 2017-03-27 22:20:21 · 232 阅读 · 0 评论 -
Hive2.1.1安装与配置
Hive2.1.1安装与配置 1、配置hive环境变量 修改环境变量 vi .bash_profie 加入hive相关的环境变量 export HIVE_HOME=/usr/hive-2.1.1 ##我的安装路径 export PATH=$HIVE_HOME/bin:$HIVE_HOME/conf:$PATH 2、修改Hive的配置文件 到hive 配置文件目录中 cd /u原创 2017-10-27 13:37:40 · 510 阅读 · 0 评论 -
hive 内部表和外部表的区别和理解
转载:http://www.cnblogs.com/qiaoyihang/p/6225151.html 1. 内部表 create table test (name string , age string) location '/input/table_data'; 注:hive默认创建的是内部表 此时,会在hdfs上新建一个test表的数据存放地转载 2017-11-01 15:17:22 · 908 阅读 · 1 评论