![](https://img-blog.csdnimg.cn/direct/0ee9fd4c3c5c41aa974abd53f05095c2.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Hadoop
文章平均质量分 79
Hadoop从0开始,教你如何搭建环境、文件系统等,后续更新完整项目
OpenYuan开袁
23届毕业生,专注于Java领域的开发,但不局限于Java纵向领域发展,只做高质量的技术文章,一起探讨Java生态圈的技术发展。接Hadoop集群搭建
展开
-
【Hadoop实战】Hadoop集群搭建攻略零失误,最完整的Hadoop搭建流程
Hadoop搭建攻略,HDFS教程,MapReduce,网络配置,免密配置,环境配置,核心配置文件,授权访问等等原创 2024-04-19 23:06:06 · 1007 阅读 · 0 评论 -
如何在IDEA编译器中连接HDFS,运行MapReduce程序
⭐ ⭐ ⭐ ⭐ ⭐ 博主信息⭐ ⭐ ⭐ ⭐ ⭐博主名称:Yuan-Programmer链接直达:https://bbs.csdn.net/topics/603957283链接直达:https://bbs.csdn.net/topics/603957283链接直达:https://bbs.csdn.net/topics/603957283链接直达:https://bbs.csdn.net/topics/603957283⭐ ⭐ ⭐ ⭐ ⭐ 点点五星⭐ ⭐ ⭐ ⭐ ⭐我正在参加年度.原创 2022-01-03 00:09:22 · 5125 阅读 · 10 评论 -
Hadoop实战——MapReduce实现主播的播放量等数据的统计及TopN排序(第二篇)
本次实战项目一共分三篇教学(第三篇下周更新)第一篇:对主播文本数据的清洗,从大量数据中获取我们所需要的数据(如播放量,时长等)第二篇:对清洗后的数据进行统计求和处理操作,按照主播id号依次整齐显示第三篇:对统计好的数据进行TopN展示的操作,排序规则可自定义(如播放量,粉丝数量),N的大小也可以自定义所有技术、实战教学文章总目录点击此处链接目录前言:一、流程简介二、创建Maven工程项目(1)新建maven(2)添加依赖三、编写MapReduce程序....原创 2021-11-28 08:00:00 · 3818 阅读 · 8 评论 -
Hadoop实战——MapReduce实现主播的播放量等数据的统计及TopN排序(第一篇)
本次实战项目一共分三篇教学(二三篇后续更新)第一篇:对主播文本数据的清洗,从大量数据中获取我们所需要的数据(如播放量,时长等)第二章:对清洗后的数据进行统计处理操作,对相同的主播id进行对应播放量等的求和统计,同时对id号进行从小到大的升序操作第三章:对统计好的数据进行Top10展示的操作,Top10的排序规则可自定义(如播放量的Top10,粉丝量的Top10等),当然也可以进行Top100的操作,都是自己定义的目录一、流程介绍二、创建Maven工程项目(1)创建Maven.原创 2021-11-23 13:18:02 · 8970 阅读 · 11 评论 -
Hadoop——HDFS文件系统的Java API操作(上传、下载、查看、删除、创建文件)详细教学
如果还没有配置好Hadoop的可以点击链接查看如何配置各大技术基础教学、实战开发教学(正在持续更新中······)首先,启动Hadoop集群服务然后在浏览器访问Hadoop,点击Browse the file system 查看HDFS文件系统的目录可以看到目前HDFS文件系统的目录是空的,没有任何的文件和文件夹,下面开始今天的API操作一、创建Maven项目首先,打开IDEA,点击新建项目,在左侧中选择Maven,然后直接点击next设置项目名称,点...原创 2021-11-21 10:54:46 · 28705 阅读 · 10 评论 -
Hadoop集群的搭建(结束)——修改hadoop配置文件以及启动集群服务
(1)修改 hadoop-env.sh 文件(2)修改 yarn-env.sh 文件(3)修改 core-site.xml 文件(4)修改 hdfs-site.xml 文件(5)修改 mapred-site.xml 文件(6)修改 yarn-site.xml 文件(7)修改 masters 文件(8)修改 slaves 文件原创 2021-11-16 23:19:08 · 13925 阅读 · 27 评论 -
Hadoop实战——MapReduce对英文单词文本进行统计和排序(超详细教学,算法分析)
用IDEA编写MapReduce程序,生成Jar包,启动Hadoop,执行Jar包程序,在HDFS文件系统中查看单词统计和排序结果原创 2021-11-10 20:38:28 · 13276 阅读 · 16 评论 -
Hadoop集群搭建(三)——JDK和Hadoop的安装和环境配置
上次我们介绍了一些基本的配置操作,接下来我们讲解如何配置安装JDK和Hadoop原创 2021-11-10 13:52:17 · 5534 阅读 · 0 评论 -
eclipse从HDFS下载文件报错java.io.IOException: (null) entry in command string: null chmod 0644
我们在eclipse中从HDFS下载文件的时候,报了这样一个错误原因是没有配置Hadoop的环境变量,但是去配置的话又比较麻烦,所以我们用另外一种快捷的方法使用FileSystem自带的方法,只需要在方法里设置两个参数重新测试一次就能成功下载了...原创 2021-11-08 22:11:08 · 1407 阅读 · 0 评论 -
启动hive报错:Cannot create directory /tmp/hive. Name node is in safe mode
启动hive报错如下信息这是由于缺少配置环境造成,解决方法如下:输入指令vi /etc/profile编辑系统环境变量,在最下面添加两行配置信息export HIVE_HOME=/export/servers/hive-1.2.1 #你的Hive文件夹路径export PATH=$PATH:$HIVE_HOME/bin保存退出之后,输入指令source /etc/profile生效环境变量,最后再去启动hive就不会报错啦...原创 2021-10-26 19:03:09 · 3546 阅读 · 0 评论 -
Hadoop集群搭建(二)——Linux系统SSH远程双向免密登陆
我们在虚拟机中经常用ssh通过 主机名 或者 ip 登陆另一台虚拟机进行操作,但是每次登陆都需要输入密码,不方便团队间的合作开发,所以我们可以设置免密登陆,下次登陆其他虚拟机设备时就不需要再输入密码了要了解双向免密登陆之前,首先学会单向的免密登陆...原创 2021-10-11 22:35:46 · 2276 阅读 · 7 评论 -
Hadoop集群搭建(一)——Liunx网络、主机名配置,多台虚拟机的相互连通和远程登陆
注重版权,转载请注明原作者和原文链接作者:Yuan-Programmer文章目录一、开发环境二、安装虚拟机,配置主机名三、网络配置四、虚拟机克隆五、多台虚拟机的连通一、开发环境系统环境系统版本Windows10linuxCentOs 7 64位开发工具工具版本VMwareWorkstation 16 proJDK1.8.0_65Hadoop2.7.3以上是本次搭建Hadoop的开发环境,版本跟我的不一样也是可..原创 2021-10-07 21:37:42 · 3449 阅读 · 9 评论