可乐不加冰.482-CSDN博客

原创期中2024.4.26

先查看端口，看是否被占用，如果被占直接kill - 9 端口号然后找到core-site.xml文件进行编写将里面的端口号改为其它。原文链接：https://blog.csdn.net/m0_74038727/article/details/138244811。2，进入Hadoop的安装目录找到存放data，name的目录（一般默认在Hadoop的tmp/dfs下）更改ID号使其data和name里的VERSION clusterID相同（name和data里的都要更改）

2024-04-28 19:41:04 218

原创 2024/4/15

yum仓库就是使用yum命令下载软件的镜像地址。我们通常使用 yum install 命令来在线安装 linux系统的软件，这种方式可以自动处理依赖性关系，并且一次安装所有依赖的软件包。众所周知，从国外下载软件速度非常慢，很多情况下都无法下载。国内一些大公司做镜像同步国外的软件，那么我们可能使用国内的下载地址，就能下载我们需要的软件。

2024-04-25 20:17:07 709

原创 24.4.7

将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件，更名为 hive-site.xml。3.3.6 将以下位置的 ${system:java.io.tmpdir}/${system:user.name} 替换为“/usr/local/src/hive/tmp”目录及其子目录。MySQL 数据库安装后的默认密码保存在/var/log/mysqld.log 文件中，在该文件中以。至此，Hive 组件安装和配置完成。

2024-04-09 14:50:09 734

原创 2024/3/15

借助于YUM软件仓库，可以完成安装、卸载、自动升级rpm软件包等任务，能够自动查找并解决rpm包之间的依懒关系，而无须管理员逐个、手工地安装每个rpm包，使管理员在维护大量Linux服务器时更加轻松自如。

2024-03-15 11:21:01 838 1

原创【一分钟教你如何成为大数据专家】看完这篇年入百万不是梦

（2）Spark容错性高，它通过弹性分布式数据集RDD来实现高效容错，RDD是一组分布式的存储在节点内存中的只读性的数据集，这些集合石弹性的，某一部分丢失或者出错，可以通过整个数据集的计算流程的血缘关系来实现重建，mapreduce的容错只能重新计算。spark是借鉴了Mapreduce,并在其基础上发展起来的，继承了其分布式计算的优点并进行了改进，spark生态更为丰富，功能更为强大，性能更加适用范围广，mapreduce更简单，稳定性好。这种备份方式不影响数据库的正常运行，但是需要停止数据库的服务。

2024-03-13 16:02:53 432

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 期中2024.4.26

原创 2024/4/15

原创 24.4.7

原创 2024/3/15

原创 【一分钟教你如何成为大数据专家】看完这篇年入百万不是梦

空空如也

空空如也

原创期中2024.4.26

原创【一分钟教你如何成为大数据专家】看完这篇年入百万不是梦