Yetta!-!-CSDN博客

原创机器学习深度学习和统计学，数据挖掘的区别

机器学习。是人工智能的一个子集，它赋予计算机一定的独立思考能力。这之所以能够实现，是因为给它大量的数据，由算法处理这些数据，然后从中学习，以便作出预测和决定，这个过程并没有专门的编程。机器能够高效地从现有例子中进行学习，以解决新问题。深度学习是一种受人类大脑神经元之间的联系而启发出来的机器学习方式。研究人员对这种生物连接进行了人工模拟，成为人工神经网络。他的目的是让机器具有智能，通过神经网络来实现，神经网络就类似人的大脑，通过多次训练之后，“大脑”就可以开始具备某种能力。这个训练过程总，我们只需要告诉这

2021-11-04 16:35:07 609

原创 HDFS读数据流程

1client向namenode请求block所在的datanode节点列表； 2client从最近位置逐个依次从datanode中读取block信息； 3整个通过io流读取的过程需要校验每个快信息； 4读取完成，关闭所有流。首先调用FileSystem的open方法获取一个DistributedFileSystem实例；然后DistributedFileSystem实例通过RPC在NameNode里获得文件的第一批block的locations（可能是需要读取文件的全部，也可能是一部分），同一个b

2021-11-02 23:59:59 234

m0_61238627的博客

原创机器学习深度学习和统计学，数据挖掘的区别

原创 HDFS读数据流程

原创 YARN的工作流程

原创 HDFS写数据流

原创节点距离计算

原创 HDFS的block和切片（split)的区别

实验十一.ms14

空空如也

原创 机器学习深度学习和统计学，数据挖掘的区别

原创 HDFS读数据流程

原创 YARN的工作流程

原创 HDFS写数据流

原创 节点距离计算

原创 HDFS的block和切片（split)的区别

实验十一.ms14

空空如也

原创机器学习深度学习和统计学，数据挖掘的区别

原创节点距离计算