大数据
YUK_103
随缘更新
展开
-
The root scratch dir: /tmp/hive on HDFS should be writable. Current permissions are: rwx------
当时不小心CTRL C 后就出现了这个情况 解决方法 删除HDFS中的/tmp/hive 文件 hadoop fs -rm -r /tmp/hive原创 2020-07-23 11:12:09 · 2723 阅读 · 0 评论 -
对某大数据比赛的总结
前言 很惨,队友在配置hive的hive-site.xml 时少打了一个"property",导致前一个小时一点进展都没有。但最后我们还是克服了困难,没有让自己太难看。很累。 内容 0x01:环境准备 配置hosts文件,关闭防火墙,开启集群环境(zookeeper,hadoop,spark) 这一部分没有什么好讲的,多练练就行了 0x02:数据仓库的搭建 mysql,hive的安装 注意事项:s...原创 2019-10-29 00:39:40 · 1022 阅读 · 2 评论 -
对一次爬虫的总结
前言:大数据决赛要开始了,团队里数据爬取的任务就交给我吧 找到一个例题 让我们来搞一手吧。 爬取前的准备 所用语言:python 所用的库:bs4,requests,urllib,re 这两个库是一定没有的,我们需要下载: pip install beautisoup4 pip install requests 其他两个库如果没有的话也自行pip下载。 如果你连pip都没有的话回头另讲: 爬...原创 2019-10-26 21:40:45 · 321 阅读 · 0 评论 -
关于hadoop集群Web UI访问处理方法
修改hdfs-site.xml文件里的的dfs.namenode.http-address,修改为0.0.0.0:50070。 然后再访问master:50070 やった!!! 終わり。原创 2019-10-08 21:39:52 · 977 阅读 · 0 评论