- 博客(4)
- 收藏
- 关注
原创 Hadoop核心技术
NameNode负责管理文件系统的命名空间和客户端请求的处理,而DataNode负责实际的数据存储和处理。:HDFS将文件划分为固定大小的数据块(通常默认为128MB或256MB),并将每个数据块的多个副本存储在不同的节点上。:为了提高容错性和可靠性,HDFS会将每个数据块的多个副本存储在不同的DataNode上。每个文件被分成一系列的块,这些块被复制到集群中的不同节点上,以提高容错性和可靠性。总的来说,HDFS是一个适用于大规模数据存储和处理的分布式文件系统,具有高容错性、高可靠性和高吞吐量的特点。
2024-05-03 15:58:48 775 1
原创 python数据化分析之分组统计
分组分析的相关概念分组分析的相关概念大数据分组分析是指在大数据中,根据特定的属性或规则将数据划分为不同的组或类别,并对每个组进行分析和比较。这种分析方法可以帮助人们发现数据中的模式、趋势和关联性,从而更好地理解和利用大数据。在大数据分组分析中,通常会根据某些特定的属性或规则将数据进行分组。这些属性或规则可以是数值型的,如年龄、收入等,也可以是分类型的,如性别、地区等。分组后,可以对每个组进行统计分析,比较不同组之间的差异和相似性。常用的分析方法包括描述性统计、频率分析、关联规则挖掘等。
2023-12-22 11:22:13 1006
原创 爬取网页数据之urllib库
什么是urllib库什么是urllib库urllib是一个Python标准库,它包含了用于处理URL的模块,可以用来创建、打开、阅读和修改从互联网上获取的数据。该库包含了多个模块,包括urllib.request、urllib.parse、urllib.error、urllib.robotparser和urllib.response。
2023-12-20 19:41:14 898
原创 Java--if分支语句
从这里看代码,条件编写是没有问题的,但是在逻辑上出现了问题,输入大于等于60的数,无论输多少,都是输出及格,这个时候就出现一种情况,其他条件没有运行出来,这串代码只有两种结果“及格”与"不及格"。转换标准如下:大于等于90分为“优秀”,小于90分大于80分为“良”,小于80分大于等于70分为“中”,小于70分大于等于60分为‘及格“,60分以下为”不及格“。转换标准如下:90分以上为“优”,80分以上“良”,70分以上为“中”,60分以上为“及格”,60分以下为“不及格”。否则,程序将执行语句2并结束。
2023-11-29 21:06:58 1066 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人