面试琐碎知识小结(持续更新)

目录


Hadoop集群搭建的步骤


1.设置IP地址
2.配置host文件(写上集群里所有的机器及其对应的IP)
3.关闭防火墙
4.配置免密码登陆SSH
5.安装JDK
6.安装Hadoop
7.配置文件:hdfs-site.xml、mapred-site.xml、yarn-site.xml、core-site.xml、hadoop-env.sh

Spark提交到Yarn上的过程


1.将代码打包
2.通过Spark submit提交到Yarn上运行
3.接下来就是以yarn为资源管理器来运行Spark程序,具体过程可以参考我写的这篇博客

Hadoop杀死一个job


1.首先查看job id
hadoop job -list
2.通过id删除job
hadoop job -kill jobID

python-openCV的颜色空间转换


img1 = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
后面是要转化的目标

RDD的特点


1.弹性的,也就是容错性(依赖,checkpoint)
2.不可变性,也就是只读
3.是一个分区集合
4.分布式的,分布在很多节点上
5.持久化,支持将会被重用的 RDD 缓存 ( 如 in-memory 或溢出到磁盘 )
6.批量操作

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值