![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
gaochao1995
这个作者很懒,什么都没留下…
展开
-
基于hive的日志数据统计实战
一、 hive 简介 hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。 它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理机制,并采用 HQL (类 SQL )语言对这些数据进行自动化管理和处理。我们可以把 hive 中海量结构化数据看成一个个的表,而实际上这些数据是分布转载 2014-08-27 09:55:37 · 501 阅读 · 0 评论 -
Hive安装及使用攻略
http://blog.fens.me/hadoop-hive-intro/转载 2014-08-27 15:48:00 · 296 阅读 · 0 评论 -
使用Hive进行手机流量统计
最近面试,发现很多公司在使用hive对数据进行处理。 hive是hadoop家族成员,是一种解析like sql语句的框架。它封装了常用MapReduce任务,让你像执行sql一样操作存储在HDFS的表。 hive的表分为两种,内表和外表。 Hive 创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变。 在删除表的时候,内部表的元数转载 2014-09-25 16:39:41 · 1048 阅读 · 0 评论 -
hive使用案例和UDF
用hive来进行日志分析有一段时间了,这里简要记录下我使用UDF和存储与导出hsql结果的实现方式,以供参考。 (一)UDF 开发与使用案例 1、创建Maven工程,开发UDF(基于hadoop2.2.0+hive-0.12.0)。 [html] view plaincopy dependencies> dependency>转载 2014-09-25 16:28:14 · 490 阅读 · 0 评论 -
Hive内部表、外部表区别
hive内部表、外部表区别自不用说,可实际用的时候还是要小心。 1. 内部表: [sql] view plaincopyprint? create table tt (name string , age string) location '/input/table_data'; 此时,会在hdfs上新建一个tt表的数据存放地,例如,笔者是在 hdfs:/转载 2015-03-27 11:17:29 · 1605 阅读 · 0 评论 -
hive文件存储格式
hive在建表是,可以通过‘STORED AS FILE_FORMAT’ 指定存储文件格式 例如: > CREATE EXTERNAL TABLE MYTEST(num INT, name STRING) > ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' > STORED AS TEXTFILE转载 2015-05-08 13:28:46 · 329 阅读 · 0 评论