- 博客(5)
- 收藏
- 关注
原创 搭建单机版伪分布式Hadoop+Spark+Scala
复制mapred-site.xml.tmplate 名为mapred-site.xml。,进入页面可以查看NameNode和DataNode 信息。编辑mapred-site.xml文件。卸载自带 OpenJDK。检查 JAVA 是否可用。在浏览器的地址栏输入。
2024-04-26 16:59:03 408 4
原创 Hive 组件安装配置
3.3.6 将以下位置的 ${system:java.io.tmpdir}/${system:user.name} 替换为“/usr/local/src/hive/tmp”目录及其子目录。将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。修改 MySQL 数据库配置,在/etc/my.cnf 文件中添加 MySQL 数据库配置项。启动 MySQL 数据库并查询 MySQL 数据库状态。
2024-04-07 23:52:20 483 1
原创 配置IP以及yum仓库
root@localhost ~]# vi /etc/sysconfig/network-scripts/ifcfg-ens32(编辑配置文件)先在虚拟机设置里面连接iso镜像。
2024-03-15 11:15:11 329 1
原创 关于Spark和MapReduce,一篇文带你看清楚
非结构化数据:指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如word、pdf、ppt及各种格式的图片、视频等。其实除了结构化数据和非结构化数据,还有一类是半结构化数据,那什么是半结构化数据?半结构化数据:指非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、E-mail等;结构化数据类型是一种用户定义的数据类型,它包含一些非原子的元素,更确切地说,这些数据类型是可以分割的,它们既可以单独使用,又可以在适当情况下作为一个独立的单元使用。
2024-03-11 14:53:51 1019 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人