大数据实验随记

本文记录了在华为云Linux服务器上进行大数据技术实验的过程,包括Hadoop的部署、环境变量配置、问题排查以及WordCount函数的实现。还涉及了HBase数据库的搭建和操作,以及分布式环境下文件的读取方式。实验中强调了配置细节,如环境变量设置、端口开放、集群通讯等问题,并提供了问题解决方案。
摘要由CSDN通过智能技术生成

BUPT果园大数据技术与运用课程随记

课程通过华为云linux服务器搭建大数据环境,完成课程中的实验

实验大体根据实验指导可完成,本文记载一些细枝末节以供debug参考

常用linux操作:

vim的使用小技巧: 比如 q!不保存退出 wq保存退出  g 全局查询/替换 gg=G缩进等 

常用的进程操作: ctrl+c ctrl+z jobs kill grep netstat bg fg 等用于查询进程或端口状态,是否成功运行、或是将进程前后台放置以节省等待时间等

常用的服务器操作: scp 正则表达 wget 等可以有效节省键鼠操作下载、copy、移动文件的时间

实验一、华为云服务器hadoop部署

linux环境变量配置:

查看变量路径使用 '$'+'变量名' 查看

1.etc/profile中配置,系统变量,多用户共用,重启shell后续执行source命令才生效

2.etc/.bashrc中配置,用户级环境变量,永久生效

3.etc/environment中配置,用户级变量,永久生效(似乎执行时间晚于.bashrc文件,可覆盖.bashrc文件路径)

云服务器相关:

任何从主机访问都是外网访问,需要开放对应端口相关权限

如50070端口调试、50075端口下载文件、8020端口通讯等

hadoop配置文件:

相关信息:

1.datanode数据节点存储数据,nodemanager管理datanode,与所管

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值