- 博客(5)
- 收藏
- 关注
原创 期中2024.4.26
先查看端口,看是否被占用,如果被占直接kill - 9 端口号然后找到core-site.xml文件进行编写 将里面的端口号改为其它。原文链接:https://blog.csdn.net/m0_74038727/article/details/138244811。2,进入Hadoop的安装目录 找到存放data,name的目录(一般默认在Hadoop的tmp/dfs下)更改ID号使其data和name里的VERSION clusterID相同(name和data里的都要更改)
2024-04-28 19:41:04 218
原创 2024/4/15
yum仓库就是使用yum命令下载软件的镜像地址。我们通常使用 yum install 命令来在线安装 linux系统的软件, 这种方式可以自动处理依赖性关系,并且一次安装所有依赖的软件包。众所周知,从国外下载软件速度非常慢,很多情况下都无法下载。国内一些大公司做镜像同步国外的软件, 那么我们可能使用国内的下载地址,就能下载我们需要的软件。
2024-04-25 20:17:07 709
原创 24.4.7
将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。3.3.6 将以下位置的 ${system:java.io.tmpdir}/${system:user.name} 替换为“/usr/local/src/hive/tmp”目录及其子目录。MySQL 数据库安装后的默认密码保存在/var/log/mysqld.log 文件中,在该文件中以。至此,Hive 组件安装和配置完成。
2024-04-09 14:50:09 734
原创 2024/3/15
借助于YUM软件仓库,可以完成安装、卸载、自动升级rpm软件包等任务,能够自动查找并解决rpm包之间的依懒关系,而无须管理员逐个、手工地安装每个rpm包,使管理员在维护大量Linux服务器时更加轻松自如。
2024-03-15 11:21:01 838 1
原创 【一分钟教你如何成为大数据专家】看完这篇年入百万不是梦
(2)Spark容错性高,它通过弹性分布式数据集RDD来实现高效容错,RDD是一组分布式的存储在 节点内存中的只读性的数据集,这些集合石弹性的,某一部分丢失或者出错,可以通过整个数据集的计算流程的血缘关系来实现重建,mapreduce的容错只能重新计算。spark是借鉴了Mapreduce,并在其基础上发展起来的,继承了其分布式计算的优点并进行了改进,spark生态更为丰富,功能更为强大,性能更加适用范围广,mapreduce更简单,稳定性好。这种备份方式不影响数据库的正常运行,但是需要停止数据库的服务。
2024-03-13 16:02:53 432
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人