清舒三岁了-CSDN博客

原创统计学、数据挖掘、机器学习和深度学习的区别

统计学：通过搜索、整理、分析数据等手段，，以达到推断所测对象的本质甚至预测对象未来的一门综合性科学，用到了大量的数学及其他学科的专业知识。机器学习：设计和分析一些让计算机可以自动“学习”的算法，是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。数据挖掘：从数据库中揭示出隐含的、先前未知的并有潜在价值的信息的过程。深度学习：是机器学习中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据。区别：统计学是机器学习和数据挖掘的基础，主要通过人

2021-11-03 21:20:22 583

原创 YARN的工作机制

YARN主要由两个核心步骤构成，分别是ResourceManager和NodeManager;当用YARN进行大数据计算时，可以划分为五个阶段：一：作业提交阶段：Client申请计算资源的应用并向整个集群提交job同时申请一个job-id,当ResourceManager收到Client的请求后，给Client返回一个资源提交路径和job-id,当Client收到ResourceManager的返回后，根据这些返回数据的值发送一个jar包，上传计算所需要的资源到指定的位置，之后向ResourceMana

2021-10-30 23:04:39 1284

qq_62615118的博客

原创统计学、数据挖掘、机器学习和深度学习的区别

原创 YARN的工作机制

原创 HDFS的block与切片（split)的区别

原创节点距离计算

原创 HDFS读数据流程

原创 HDFS写数据流程

空空如也

空空如也

原创 统计学、数据挖掘、机器学习和深度学习的区别

原创 YARN的工作机制

原创 HDFS的block与切片（split)的区别

原创 节点距离计算

原创 HDFS读数据流程

原创 HDFS写数据流程

空空如也

空空如也

原创统计学、数据挖掘、机器学习和深度学习的区别

原创节点距离计算