Hive
文章平均质量分 60
关山难越_谁悲失路之人
这个作者很懒,什么都没留下…
展开
-
hive_1.2.1安装及配置(相关安装文件待整理)
配置Hive:1)解压缩apache-hive-1.2.1-bin.tar.gz 文件,tar -zxf apache-hive-1.2.1-bin.tar.gz,这里解压在/opt目录下。2)配置Hive,进入/opt/apache-hive-1.2.1-bin/conf目录,cp hive-env.sh.template hive-env.sh,vi hive-env.sh,添原创 2016-12-13 16:31:39 · 546 阅读 · 0 评论 -
hive中日期与时间戳转换
从1970-01-01 00:00:00 UTC到指定时间的秒数。总结:时间戳到日期时间,日期时间到时间戳,日期时间到日期。获取时间戳:select distinct unix_timestamp() from test_date;时间戳>>>>日期:select distinct from_unixtime(1441565203,'yyyy/MM/dd HH:mm:原创 2016-12-13 16:34:17 · 141715 阅读 · 0 评论 -
Pig Hive相关小问题学习网址
1.PageRank算法简介及Map-Reduce实现http://blog.jobbole.com/71431/2. pig学习笔记http://blog.csdn.net/shifenglov/article/details/385845273.Hive 学习笔记(三)http://blog.csdn.net/gg584741/article/details原创 2016-12-13 16:47:08 · 285 阅读 · 0 评论 -
用Hive+Hadoop集群实现《飞机票购买人群分类案例》思路+代码 (实验数据待整理)
当今社会,事事存在竞争,航空公司也不例外。想要从林立的航空公司中立足,就要有稳定且增长的盈利。怎么保证这个盈利呢?这就要从营销策略上下手了,针对不同的客户采取不同的营销策略,才能保证最大的盈利。那怎么找出不同的客户群呢?这就是这篇文章首先要探索的。整体思路如下:1.根据航空公司的客户数据,对客户进行分类。 2.对不同的客户类别进行特征分析,比较不同类客户的客户价值。 3.对不同价值的客户类原创 2016-12-13 16:35:09 · 1844 阅读 · 0 评论 -
我的小锦囊之Hadoop集群的启动命令以及经常遇到的小问题
每天启动Hadoop集群时都会打开这份txt文档,现在看来觉得这份文档才是精髓,看一眼,就能理一遍思路。如下的命令中,有启动Hadoop集群的,zookeeper集群的,hbase的,启动spark的,当然还有像Pig、Hive这些,直接输入就能进入。总之,如果没有下面这个文档,每天遇到一些问题可能会毛手毛脚,甚至可能因为睡得懵懵的而忘了启动路径....1.启动hadoop集群原创 2016-12-29 09:30:51 · 857 阅读 · 0 评论