scala
文章平均质量分 75
eight_Jessen
这个作者很懒,什么都没留下…
展开
-
Spark十一:面试问题
完整内容见:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ。原创 2024-01-12 10:31:15 · 835 阅读 · 0 评论 -
Spark十:故障排除
Spark常见故障和排除方法学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ。原创 2024-01-12 10:24:37 · 1108 阅读 · 0 评论 -
Spark九:Spark调优之Shuffle调优
Spark shuffle调优方法,map端和reduce端缓存大小设置,reduce端重试次数和等待时间间隔,以及bypass设置原创 2024-01-11 09:44:00 · 930 阅读 · 0 评论 -
Spark八:Spark性能优化
Spark调优的方法,包括RDD使用、文件读取,partition等原创 2024-01-10 09:47:47 · 555 阅读 · 0 评论 -
Spark七:Spark数据倾斜
Spark中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,由不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。本节学习数据倾斜问题的避免与缓解。原创 2024-01-09 09:59:31 · 914 阅读 · 0 评论 -
Spark六:Spark 底层执行原理SparkContext、DAG、TaskScheduler
学习Spark运行流程原创 2024-01-08 09:45:04 · 1279 阅读 · 0 评论 -
Spark五:Spark的两种核心Shuffle
Spark 也有 Map 阶段和 Reduce 阶段,因此也会出现 Shuffle,介绍Spark的两种核心Shuffle,Hash Shuffle和Sort Shuffle原创 2024-01-05 09:41:07 · 1742 阅读 · 0 评论 -
Spark四:Spark Streaming和Structured Streaming
介绍Spark Streaming整体流程和DStream介绍Structured Streaming发展历史和Dataflow模型介绍。原创 2024-01-05 09:34:39 · 1410 阅读 · 0 评论 -
Spark三:Spark SQL
数据分析的方式,数据分类饿SparkSQL使用场景。几种数据抽象和SparkSQL读写数据和处理数据的两种风格:SQL风格和DSL风格原创 2024-01-04 09:59:31 · 980 阅读 · 0 评论 -
Spark一:Spark介绍、技术栈与运行模式
Spark官网。原创 2024-01-02 14:58:38 · 1153 阅读 · 0 评论 -
Spark二、Spark技术栈之Spark Core
spark核心:包括RDD、RDD算子、RDD的持久化/缓存、累加器和广播变量。原创 2024-01-03 11:20:49 · 1347 阅读 · 0 评论 -
scala学习八:类和对象
类是对象的抽象,而对象是类的具体实例。类是抽象的,不占用内存,而对象是具体的,占用存储空间。类是用于创建对象的蓝图,它是一个定义包括在特定类型的对象中的方法和变量的软件模板。Scala中的类不声明为public,一个Scala源文件中可以有多个类。以上实例的类定义了两个变量 x 和 y ,一个方法:move,方法没有返回值。Scala 的类定义可以有参数,称为类参数,如上面的 xc, yc,类参数在整个类中都可以访问。可以使用new来实例化类,并访问类中的方法和变量。原创 2023-12-27 09:44:32 · 440 阅读 · 0 评论 -
scala学习七:集合
Scala提供了一套很好的集合实现,提供了一些集合类型的抽象。Scala 集合分为可变的和不可变的集合。可变集合可以在适当的地方被更新或扩展。可以修改,添加,移除一个集合的元素。而不可变集合类,永远不会改变。不过,仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变。原创 2023-12-26 10:03:17 · 1048 阅读 · 2 评论 -
scala学习六:数组
多维数组一个数组中的值可以是另一个数组,另一个数组的值也可以是一个数组。矩阵与表格是我们常见的二维数组。数组里面的每个元素是相同的数据类型,一般用for循环处理。range() 方法最后一个参数为步长,默认为 1。存储固定大小的同类型元素。原创 2023-12-20 09:46:25 · 464 阅读 · 0 评论 -
scala学习五:字符串
String 类中可以使用 printf() 方法来格式化字符串并输出,String format() 方法可以返回 String 对象而不是 PrintStream 对象。Scala中,string是不可变对象,不可修改。如果修改字符串,会产生新的字符串对象。Scala中的字符串类型实际上是Java String,它本身没有String。如果想创建一个可以修改的字符串,可以使用String Builder 类。, index从0开始。原创 2023-12-19 11:18:23 · 726 阅读 · 1 评论 -
scala学习四:方法与函数
由一个 def 关键字开始,紧接着是可选的参数列表,一个冒号 : 和方法的返回类型,一个等于号 = ,最后是方法的主体。如果方法没有返回值,可以返回Unit,类似于Java里面的voiddef functionname([参数列表]):[return type] = {以上代码中 return type 可以是任意合法的 Scala 数据类型。参数列表中的参数可以使用逗号分隔。函数里面的返回不需要写 return ,直接写要返回的数据return sum。原创 2023-12-18 15:59:41 · 559 阅读 · 0 评论 -
Scala学习三:条件语句/循环语句
Scala 语言中默认是没有 break 语句,但是在 Scala 2.8 版本后可以使用另外一种方式来实现 break 语句。当在循环中使用 break 语句,在执行到该语句时,就会中断循环并执行循环体之后的代码块。原创 2023-12-15 10:20:38 · 512 阅读 · 0 评论 -
Scala学习二:访问修饰符/运算符
访问修饰符/运算符原创 2023-12-11 20:01:14 · 702 阅读 · 0 评论 -
Scala学习一:语法基础/数据类型/变量
scala学习:语法基础/数据类型/变量原创 2023-12-11 19:56:57 · 1234 阅读 · 0 评论 -
Scala日志log4j,序列化Gson
对于 Maven 项目,可以在 pom.xml 文件中添加以下内容:</</</</原创 2023-12-11 16:59:18 · 618 阅读 · 0 评论 -
创建scala项目并增加新的object试运行
依赖配置:没有maven也可以创建。原创 2023-10-16 16:23:07 · 741 阅读 · 0 评论