自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 hadoop的基础操作

hadoop是一个由基金会所开发的。hadoop的框架最核心的设计就是HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。hadoop具有高容错性,常部署在低廉的硬件上,而且它拥有高吞吐量,可以更好地访问应用程序中的数据,适合有着大数据集的应用程序,可以使用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。

2024-05-11 20:54:27 823 2

原创 爬取静态网页数据

opener是urllib.request.OpenerDirector类的对象,我们之前一直都在使用的urlopen,就是模块帮我们构建好的一个opener自定义opener需要执行下列三个步骤:我们可以使用urllib.request中的ProxyHandler方法来设置代理服务器。免费开放代理的获取基本没有成本,可以在一些代理网站上收集这些免费代理。

2023-12-26 15:47:34 863 1

原创 Python的表格对象的统计分析

index=‘行分组变量’, # 接收string或list,表示行分组变量,即第一个分组用变量。columns=‘列分组变量’,#接收string或list,表示列分组变量,即第二个分组用变量。语法:语法:表格对象.groupby(['分组变量1','分组变量2'])['聚合变量'].聚合函数()aggfunc=‘聚合函数’, # 接收函数名称,表示聚合函数,默认是均值函数mean。返回结果是一个series序列对象,索引是分组变量,值是聚合结果。axis默认为0,表示删除行,axis=1时删除列。

2023-12-21 10:21:54 879

原创 关于Java类的基础

类和对象是面向对象编程中的核心概念。类是一个抽象的概念,它描述了一类具有相同属性和方法的对象。具体来说,类定义了对象的属性和方法的集合,也就是描述了对象的行为和状态。对象则是类的一个实例,它拥有类定义中所定义的属性和方法。可以通过创建对象来调用类中定义的方法和操作属性。构造方法是一种特殊的方法,用于创建并初始化对象。它与类同名,没有返回类型,且在创建对象时自动被调用。构造方法可以用来初始化对象的数据成员,执行其他初始化操作,调用其他方法等。在创建对象时,JVM会自动调用该类的构造方法来初始化对象。

2023-12-08 23:08:55 58

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除