自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(70)
  • 收藏
  • 关注

原创 Spark操作 对json复杂和嵌套数据结构的操作

从Json取值-----get_json_object,to_json()将获取的数据转化为json格式,对嵌套结构的处理(样例类和炸裂函数使用来解决)。

2023-04-13 15:36:03 903 1

原创 linux安装kafka

kafka安装和基本使用代码

2023-04-13 15:13:25 748

原创 Spark 对hadoopnamenode-log文件进行数据清洗并存入mysql数据库

对hadoop日志文件进行数据清洗

2023-04-12 23:06:08 788

原创 Spark对正常日志文件清洗并分析

日志分析

2023-04-12 17:51:59 1281

原创 补充——spark RDD序列化和持久化

RDD序列化和持久化以及cache和checkpoint。

2023-04-12 16:16:01 908

原创 Spark SQL join操作详解

spark join详解

2023-04-12 16:04:21 1030

原创 Spark SQL 数据的加载和保存

Spark SQL 数据的加载和保存

2023-04-11 21:06:32 732

原创 Spark SQL dataframe和dataset

dataFrame和dataSet,sparksql的运行原理

2023-04-10 14:18:34 856

原创 scala连接mysql虚拟机实现增删改查

scala连接mysql

2023-04-10 11:30:00 281

原创 spark累加器和广播变量

系统累加器,自定义累加器和广播变量原理

2023-04-09 14:46:45 453

原创 Spark RDD算子示例

转换算子和行动算子的示例

2023-04-09 14:35:38 1080

原创 Spark core 弹性式数据集RDD

RDD基本概述,依赖,shuffle,缓存级别

2023-04-07 10:12:46 456

原创 Spark集群架构和核心组件介绍

spark特点,集群架构,核心组件,有向无环图,yarn的两种模式

2023-04-06 22:39:46 2316

原创 scala函数大全

scala函数解释加实例

2023-04-06 21:17:32 3255

原创 SparkSQL-liunx系统Spark连接Hive

spark连接hive

2023-04-04 14:34:45 457

原创 Scala下划线_用法总结

scala中下划线的用法总结

2023-04-03 20:57:20 620

原创 scala泛型

协变,逆变,不变

2023-04-03 20:52:42 852

原创 Scala隐式转换

scala隐式转换参数,隐式函数和隐式类

2023-04-03 19:51:12 765

原创 scala集合

scala集合

2023-04-03 17:55:21 1305

原创 Scala模式匹配

模式匹配

2023-04-03 17:40:45 853

原创 scala匿名函数

scala匿名函数的基本概念,规则和例子

2023-04-03 17:25:22 663

原创 scala面向对象

scala面向对象学习

2023-04-03 17:18:21 563

原创 scala函数式编程

目录不同范式对比:1.面向对象编程2.函数式编程2.1函数基本语法2.2函数和方法的区别核心概念: 2.3函数定义 2.4函数参数2.5 函数至简原则2.6.高阶函数 三.偏函数四.柯里化函数五.递归函数递归函数注意点: 六.控制抽象1.值调用,把计算后的值传递过去, 2.名调用,把代码传递过去,七.惰性加载面向对象和面向过程都是命令式编程,但是函数式编程不关心具体运行过程,而是关心数据之间的映射。纯粹的函数式编程语言中没有变量,所有量都是常量,计算过程就是不停的表达式求值的过程,每一段程序都有返回值。不关

2023-04-03 16:26:17 1392 3

原创 Scala变量和数据类型

变量:在程序执行过程中,其值可以被改变(var)常量:在程序执行的过程中,其值不会被改变的变量(val)回顾:java变量和常量语法变量类型 变量名称 = 初始值 int a=10final 常量类型 常量名称 = 初始值 final int b = 20。

2023-04-03 15:47:00 1134

原创 liunx安装spark

spark安装

2023-03-27 14:39:03 1489

原创 liunx安装scala

scala安装

2023-03-27 14:07:58 338 1

原创 flume安装与配置

flume安装与配置

2023-03-10 14:16:35 2177

原创 sqoop安装

sqoop安装

2023-03-09 13:40:07 95

原创 HBase映射hive

hive连接hbase

2023-03-08 16:03:36 610

原创 liunx上安装hbase

hbase安装

2023-03-06 16:17:54 221

原创 hive基础内容学习

注意:分桶只有动态分桶,必须使用INSERT方式加载数据Hive侧视图(Lateral View)与表生成函数结合使用,将函数的输入和输出连接OUTER关键字:即使output为空也会生成结果。

2023-02-22 22:39:18 1473 1

原创 SSM框架搭建

ssm框架搭建

2023-02-21 20:51:02 1682

原创 linux上安装hive

关闭schema验证提示当前数据库名

2023-02-16 19:00:00 367

原创 hadoop高可用搭建(需要安装zookeeper)

这里以四台虚拟机为例 ant151 / ant152 / ant153 / ant154。

2023-02-16 15:14:31 818

原创 hadoop学习

HDFS是google三大论文之一的GFS的开源实现,是一个高度容错性的系统,适合部署在廉价的机器上的,适合存储海量数据的分布式文件系统。在HDFS中,文件是分成以Block Size为大小的数据块存储的,每个Block默认大小为64M或128M(可调节),如果一个文件小于一个数据块的大小,并不会占用整个数据块存储空间。这些Block被复制为多个副本,被存放在不同的主机上,这也保证了HDFS的高容错性。Block是hdfs默认的最基本的存储单位。

2023-02-07 17:12:24 987

原创 linux安装hadoop

linux的hadoop安装

2023-02-05 20:40:32 251

原创 web服务器Tomcat安装

Tomcat安装

2023-01-16 15:21:44 219

原创 mybits入门及增删改查学习

mybits入门代码,再加上新增修改删除三种操作

2023-01-09 16:49:07 1122

原创 jdbc连接mysql增删改查代码基础学习

基础的jdbc代码学习

2023-01-02 15:19:29 279

原创 mysql基础学习思维导图

ddl,dml,dcl,事务,索引思维导图整理

2022-12-14 22:09:18 68

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除