- 博客(10)
- 收藏
- 关注
原创 深度学习是什么
深度学习:是机器学习的一种,源于人工神经网络研究,通过组合低层特征形成更加抽象的高层表示类别或特征。它的研究建立在模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据。 ...
2021-11-04 14:07:25 604
原创 yarn的工作流程
1.客户端向mapreduce提交任务,applications manager接收。 2.applications manager分配资源。 3.applications manager将任务和container分配给资源调度器。 4.资源调度器将任务和containe分配给applications master。 5.applications master将任务分解为maptask和reducetask。 6.applications master将maptask和reducetask分配到nodema
2021-11-02 09:22:39 128
原创 节点距离计算
节点距离:;俩个节点到datanode最近距离的总合。 d1/r1/n0到d1/r1/n0的距离为0。 d1/r1/n0到d1/r1/n1的距离为2。 d1/r1/n0到d1/r2/no的距离为4。 d1/r1/n0到d2/r3/n0的距离为6。
2021-11-02 08:13:06 115
原创 hdfs写数据流程
1.客户端向namenode请求上传文件. 2.检查文件是否存在. 3.namenode返回客户端. 4.客户端对数据切片. 5.请求与datanode上传数据. 6.datenode之间进行建立. 7.datenode之间响应. 8.在对客户端建立. 9.客户端对datenode传数据. 10.客户端接收datenode. ...
2021-10-31 23:01:28 36
原创 hdfs读数据流程
1.客户端先去namenode请求读取。 2.namenode提供block的位置。 3.客户端去相应的datenode寻找。 4.从datenode读取数据。
2021-10-31 17:47:34 194
原创 HDFS的block和切片(split)的区别
概念: 数据块:在hdfs中,由大文件分成的小文件称为数据块。 数据切片:在mapreduce中,由大文件分为一段的文件。 区别: 大小相同但存在形式不同。
2021-10-30 20:56:28 95
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人