自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hadoop核心技术

NameNode负责管理文件系统的命名空间和客户端请求的处理,而DataNode负责实际的数据存储和处理。:HDFS将文件划分为固定大小的数据块(通常默认为128MB或256MB),并将每个数据块的多个副本存储在不同的节点上。:为了提高容错性和可靠性,HDFS会将每个数据块的多个副本存储在不同的DataNode上。每个文件被分成一系列的块,这些块被复制到集群中的不同节点上,以提高容错性和可靠性。总的来说,HDFS是一个适用于大规模数据存储和处理的分布式文件系统,具有高容错性、高可靠性和高吞吐量的特点。

2024-05-03 15:58:48 684 1

原创 python数据化分析之分组统计

分组分析的相关概念分组分析的相关概念大数据分组分析是指在大数据中,根据特定的属性或规则将数据划分为不同的组或类别,并对每个组进行分析和比较。这种分析方法可以帮助人们发现数据中的模式、趋势和关联性,从而更好地理解和利用大数据。在大数据分组分析中,通常会根据某些特定的属性或规则将数据进行分组。这些属性或规则可以是数值型的,如年龄、收入等,也可以是分类型的,如性别、地区等。分组后,可以对每个组进行统计分析,比较不同组之间的差异和相似性。常用的分析方法包括描述性统计、频率分析、关联规则挖掘等。

2023-12-22 11:22:13 869

原创 爬取网页数据之urllib库

什么是urllib库什么是urllib库urllib是一个Python标准库,它包含了用于处理URL的模块,可以用来创建、打开、阅读和修改从互联网上获取的数据。该库包含了多个模块,包括urllib.request、urllib.parse、urllib.error、urllib.robotparser和urllib.response。

2023-12-20 19:41:14 786

原创 Java--if分支语句

从这里看代码,条件编写是没有问题的,但是在逻辑上出现了问题,输入大于等于60的数,无论输多少,都是输出及格,这个时候就出现一种情况,其他条件没有运行出来,这串代码只有两种结果“及格”与"不及格"。转换标准如下:大于等于90分为“优秀”,小于90分大于80分为“良”,小于80分大于等于70分为“中”,小于70分大于等于60分为‘及格“,60分以下为”不及格“。转换标准如下:90分以上为“优”,80分以上“良”,70分以上为“中”,60分以上为“及格”,60分以下为“不及格”。否则,程序将执行语句2并结束。

2023-11-29 21:06:58 894 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除