大数据导论作业
baiin_Y
这个作者很懒,什么都没留下…
展开
-
统计学,机器学习,数据挖掘,深度学习
统计学是收集,分析,表述和解释数据的科学。作为数据分析的一种有效工具,统计方法已广泛应用于社会科学和自然科学的各个领域,是各学科领域研究者和实际工作者的必备知识。 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,为相关决策提供依据和参考。 ...原创 2021-11-04 22:44:58 · 592 阅读 · 0 评论 -
YARN工作机制
原创 2021-10-30 19:19:14 · 72 阅读 · 0 评论 -
HDFS的block和切片(split)的区别
1.block的存储是真实的。2.split的存储是虚拟的,目的是减少块的数量,方便以后读取。一个split上可能有多个block,但一个block不一定单属于一个split。原创 2021-10-30 18:18:44 · 80 阅读 · 0 评论 -
节点距离计算
1. 同一机架同一节点间的距离为1。2.同一机架不同节点之间的距离为2。3.同一集群不同机架上的节点间的距离为4。4.同一数据中心不同集群上的节点间的距离为6。原创 2021-10-30 17:29:04 · 199 阅读 · 0 评论 -
HDFS读数据流程
原创 2021-10-30 16:48:17 · 45 阅读 · 0 评论 -
HDFS 写数据流程
HDFS写数据流程导图原创 2021-10-26 20:42:16 · 71 阅读 · 0 评论