自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Python笔记

Python笔记(大数据方向)一、基本数据类型1、数字类型1.1、整型(int)i=100t=type(i)print(i,t)1.2、浮点型(float)f=12.14t=type(i)print(f,t)1.3、布尔型(False,True)b=Truet=type(b)print(b,t)2、字符串使用单引号将若干个字符括起来的序列,叫做字符串a1 = '这是一个字符串'2.1字符串格式化原始字符串拼接做法# 原始字符串拼接做法name = i

2024-09-25 19:14:22 1598

原创 Spark笔记

Apache Spark 是一个用于大规模数据处理的快速通用计算引擎,最初由加州大学伯克利分校的 AMPLab 开发,于 2010 年开源。Spark 提供了高效的分布式数据处理功能,支持多种数据处理任务,包括批处理、实时流处理、机器学习和图形处理等。Spark 提供的主要抽象是弹性分布式数据集(RDD),它是跨集群节点分区的元素集合,可以并行操作。弹性分布式数据集弹性:RDD将来在计算的时候,其中的数据可以是很大,也可以是很小。

2024-09-24 14:16:36 1220

原创 大数据面试指南--20240708

关系型数据库(RDB,Relational Database)就是一种建立在关系模型的基础上的数据库。关系模型表明了数据库中所存储的数据之间的联系(一对一、一对多、多对多)。关系型数据库中,数据都被存放在了各种表中(比如用户表),表中的每一行就存放着一条数据(比如一个用户的信息)大部分关系型数据库都使用 SQL 来操作数据库中的数据。并且,大部分关系型数据库都支持事务的四大特性(ACID)。

2024-07-08 21:25:45 1035

原创 Java总结

Java总结第三章面向对象面向对象的思想1、概述前面我们讲过数组,当有多个数组都需要遍历时,我们可以将遍历的代码封装到方法中,需要遍历时,就调用相应的方法即可,提高代码的复用性。在对数组遍历的基础上继续增加需求,比如获取最值,数值逆序等,同样需要将这些功能封装到相应的方法中。这样继续封装会发现方法越来越多,于是就想能不能将这些方法继续进行封装呢?通过前面的讲解我们知道类是可以存放方法的,所以,我们就考虑使用类封装来这多个方法,将来再做数组的操作时,不用去找具体的方法,先找到这个类,然后使用这个类中

2024-07-03 21:42:36 621

原创 Flink笔记

AApache Flink 是一个实时计算框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。这个图展示了一个典型的数据处理架构,强调了 Apache Flink 的应用场景和功能。让我们从左到右分步骤详细解释这个图。数据输入Transactions(交易)Logs(日志)IoT(物联网)Clicks(点击)(其他数据源)这些数据源可以生成实时事件(Real-time Events)或存储在。

2024-07-03 21:38:54 980 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除