自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 任务二代码

编写Scala工程代码,使用Flink消费kafka中的数据

2022-11-05 18:27:50 1046 2

原创 Hadoop1.x、2.x、3.x区别

h

2022-06-28 22:23:20 415

原创 开题报告———基于Python的网络爬虫的电影网站设计与实现

Python

2022-06-07 16:44:39 1621 1

原创 数据聚合与分组运算

01 分组与聚合的原理在Pandas中,分组是指使用特定的条件将原数据划分为多个组,聚合在这里指的是,对每个分组中的数据执行某些操作,最后将计算的结果进行整合。分组与聚合的过程大概分为以下三步:拆分→应用→合并分组与聚合的原理:在Pandas中,可以通过groupby()方法将数据集按照某些标准划分成若干个组。groupby(by=None, axis=0, level=None, as_index=True, sort=True,group_keys=Tru.

2022-05-16 20:11:58 1302

原创 01 认识NumPy数组对象

NumPy中最重要的一个特点就是其N维数组对象,即ndarray(别名array)对象,该对象可以执行一些科学计算。02 创建NumPy数组最简单的创建ndarray对象的方式是使用array()函数,在调用该函数时传入一个列表或者元组。# 创建一个一维数组data1 = np.array([1, 2, 3]) 结果是array([1,2,3])# 创建一个二维数组data2 = np.array([[1, 2, 3], [4, 5, 6]]) 结果是a...

2022-03-06 19:04:33 652

转载 storm

环境部署:一、前置安装 Zookeeper 集群,截图并保存结果 1、启动三台机器zookeeperbin/zkServer.sh start二、解压 Storm 安装包到“/usr/local/src”路径,并修改解压后文件夹名为 storm,截图并保存结果 1、进入/h3cu目录找到stormcd /h3cu 2、解压stormtar -zxvf apache-storm-1.2.4.tar.gz -C /usr/local/s...

2021-12-25 13:17:58 161

转载 kafka

环境部署:一、需安装 Zookeeper 组件具体要求同 Zookeeper 任务要求,并与 Kafka 环境适配,启动 Zookeeper 并截图保存结果 1、启动三台机器zookeeperbin/zkServer.sh start 二、解压 Kafka 安装包到“/usr/local/src”路径,并修改解压后文件夹名为 kafka,截图并保存结果 1、进入/h3cu目录找到kafkacd /h3cu 2、解压kafka...

2021-12-25 13:17:24 265

转载 Spark

环境部署:一、需前置 Hadoop 环境,并检查 Hadoop 环境是否可用,截图并保存结果 1、使用 jps 命令查看集群状态二、解压 scala 安装包到“/usr/local/src”路径下,并更名为 scala,截图并保存结果 1、进入/h3cu/目录下找到压缩包cd /h3cu/ 2、解压scalatar -zxvf scala-2.11.8.tgz -C /usr/local/src 3、重命名scala...

2021-12-25 13:16:57 654

转载 【无标题】ha

机器检查: 1、输入用户名及登录密码进行登录 2、 检查内网是否畅通 A、查看机器IP地址ip addr 注:通过观察此台机器IP为192.168.231.244 B、测试内网 注:通过观察机器内网畅通 C、测试外网 注:通过观察此台机器外网畅通 注:...

2021-12-25 13:16:11 809

原创 第6章 函数

知识梳理

2021-12-19 16:39:16 301

原创 第5章 组合数据类型

1)我们先要知道序列类型有什么?有字符串,列表和元组那么我们接下来我们一一回顾序列类型!!!分为正向递增索引和反向递减索引,当为正向递增索引时(从左到右)第一个元素始终是0,第二个才为1,反之,从右到左第一个是-1,第二个是-22)列表怎么创建呢?它有两种创建方式。list_one = [] # 使用[]创建空列表li_two = list() # 使用list()创建空列表# list=['scs','dcs',95]lis1=...

2021-12-19 16:39:10 158

原创 第4章 字符串

1) 我们要知道什么是字符串:字符串是一种用来表示文本的数据类型,它是由符号或者数值组成的一个连续序列。2)怎么定义字符串?它有3中定义方式,包括了单引号,双引号和三引号,其中三引号可定义多行'ni hao'"wo shi"''' zdhZHCJZSHCZXDC'''3)字符串的转义功能\t和\n是我们最常用的转移字符,分别表示横向制表符和换行print('pyth\ton')print('pyth\non')print('pyth\ron')p.

2021-12-19 16:39:01 103

原创 第2章 Python基础

1)良好的代码格式良好的代码格式可提升代码的可读性,与其他语言不通,Python代码的格式是Python语法的组成之一,不符合格式规范的Python代码很可能存在语法问题,在运行期间也很可能产生错误。1注释那么就是单行和多行注释单行注释:以“#”开头,单行注释既可以单独占一行,也可以位于标识的代码之后,与标识的代码共占一行。# 第一个注释print (“Hello, Python!”) # 第二个注释多行注释:多行注释是由三对双引号或单引号包裹的语句,主要用于说明函..

2021-12-19 16:38:53 206

原创 第3章 流程控制

在我看来,流程控制语句分为顺序、选择和循环三部分。包括了if语句,while语句,for循环语句。如下:if语句若if语句的判断条件成立(判断条件的布尔值为True),执行之后的代码段;若if语句的判断条件不成立(判断条件的布尔值为False),跳出选择结构,继续向下执行。if 条件表达式: 代码块if-elif-else语句一些场景不仅需要处理满足条件的情况,也需要对不满足条件的情况做特殊处理。因此,Python提供了可以同时处理满足和不满足条件的if-e...

2021-12-19 16:38:31 239

原创 第7章 文件与数据格式化

1)文件概述 文件标识:文件标识的意义:找到计算机中唯一确定的文件。文件标识的组成:文件路径、文件名主干、文件扩展名。sys模块stdin(标准输入文件)stdout(标准输出文件)stderr(标准错误文件)import sysfile = sys.stdoutfile.write("hello")hello2)文件的基本操作文件的打开、关闭与读写是文件的基础操作,任何更复杂的文件操作都离不开这些操作。open()用于打开文件:open(fi...

2021-12-18 20:51:34 148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除