![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 88
ls_6468
计算机专业
展开
-
centos6.5安装hadoop集群过程及遇到的问题
在centos6.5上安装hadoop集群,过程与遇到的问题及解决办法原创 2017-11-05 19:33:15 · 996 阅读 · 0 评论 -
hive实现50w词频统计与ctrip数据集销售额计算
用hive对50万条记录(数据文件demo50w.utf8)进行词频统计,数据清洗转换自行处理,并列出词频最高的20个词。首先准备好要统计单词的文件,并上传到hdfs上,登录hive,先创建一个表,这个表中只有一列数据,类型为string,用来存放统计单词的文件,把文件内容作为一个字符串存储。然后创建存放单词及计数结果的表,这个表的内容来自select嵌套查询。使用正则表达式进行匹配,从文件中原创 2018-03-21 11:36:05 · 1438 阅读 · 1 评论 -
centos6.5下配置hbase
1.下载并解压hbase的安装包,此版本为hbase-1.0.0-cdh5.6.0.tar2.若未安装zookeeper,则先安装zookeeper。安装文件名:zookeeper-3.4.5-cdh5.6.0.tar.gz下载地址:点击打开链接启动虚拟机,以用户身份登录master将安装文件复制到/opt目录下。[hust@master opt]$ cp /home/hust/Desktop/z...原创 2018-03-21 12:09:39 · 1815 阅读 · 0 评论