- 博客(4)
- 收藏
- 关注
原创 Hadoop伪分布式
使用SecureFX文件传输工具上传JDK,上传jdk-8u361-linux-x64.tar.gz到/opt目录下查看Linux是否安装java jdk,如果查询有其他java版本,则需要卸载在这个文件最后换行添加如下三行:vi /etc/profile使用xshell文件传输工具上传hadoop上传hadoop-2.7.1.tar到/opt目录下在这个文件最后换行添加如下三行:vi /etc/profile进行免密登录需要安装ssh如果有openssh-clients、openssh-server,则不
2024-04-25 19:31:00 1470
原创 Hadoop完全分布式搭建
另外,只要运行过HDFS,Hadoop的工作目录(本书设置为/usr/local/src/hadoop/tmp)就会有数据,如果需要重新格式化,则在格式化之前一定要先删除工作目录下的数据,否则格式化时会 出问题。可以看出 HDFS 的数据保存在/usr/local/src/hadoop/dfs 目录下,NameNode、 DataNode和/usr/local/src/hadoop/tmp/目录下,SecondaryNameNode 各有一个目 录存放数据。启动完成后,可以使用JPS命令查看是否成功。
2024-04-25 14:03:09 1799 1
原创 站在下一个风口上,我会是那个飞起来的猪吗?(基本语法)
因为@Entry表示该自定义组件为入口组件,所以执行的是“Hello World”,而不是“Wow amazing!!!可复用的UI单元,可组合其他组件。如上述被@Component装饰的struct Hello。
2024-04-01 14:01:37 368
原创 开局掉马,逃荒前我还在学Spark
Hadoop是目前应用最为广泛的分布式大数据处理框架,其具备可靠、高效、可伸缩等特点。Hadoop的核心组件是HDFS、MapReduce。1)HDFS(分布式文件系统):HDFS是整个hadoop体系的基础,它是Hadoop生态系统中的核心项目之一,是分布式计算中数据存储管理基础。2)MapReduce(分布式计算框架):是一种基于磁盘的分布式并行批处理计算模型,用于大规模数据集(大于1TB)的并行运算。
2024-03-07 17:43:23 1930 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人