自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 scala快速入门

1) JDK1.82) Scala环境变量配置Path,能够快速找到scala相关指令3) 测试cmd输入scala即可1.采用var|val关键字声明2.变量名称应该放置在变量类型之前3.var | val 变量名 :变量类型 = 变量值4.如果根据变量值可以推断出变量类型,那么变量类型就可以省略1.java中的方法在scala中就是函数,只不过方法是相对类的概念,函数在作用域内有效,方法受到类的约束2.函数就是功能的封装不属于类的,所以函数名不能重复,没有重载重写概念。

2024-07-12 15:56:08 1025 1

原创 Hive中常见的问题以及优化方案

用户表中 user_id 字段为 int,log 表中 user_id 为既有 string 也有 int 的类型, 当按照两个表的 user_id 进行 join 操作的时候,默认的 hash 操作会按照 int 类型的 id 进 行分配,这样就会导致所有的 string 类型的 id 就被分到同一个 reducer 当中。2.对于业务数据本身的特性,首先是空值产生的数据倾斜问题,常见的就是我们的日志表和业务表进行关联后出现的空值,比如关联字段为user_id,可以将user_id为空的不参与关联。

2024-06-02 09:56:09 374

原创 将文件load进hive后,查询数据时末尾数据重复问题

如果你的数据文件中存在空行(即仅包含换行符而没有其他字符的行),Hive 会将这些空行也视为有效的数据行,并尝试将它们插入到表中。原因:在linux中创建person文件时多加了一个回车键,导致多了一行空行。在linux中的/home/debu/创建一个person文件内容是。创建表 drop table if exists person;可以发现同一条数据却出现了两次。将文件load到hive表中。

2024-05-12 13:54:23 318

原创 Kafka流程以及调优

本篇文章将介绍Kafka的详细流程和Kafka生产环境中是如何进行优化的1.1Kafka是什么?Kafka是一种消息队列(Message Queue),是基于发布/订阅模式的,主要用于大数据实时处理领域,一般也可以认为kafka是一个分布式的事件流平台,用于高性能数据管道、流分析、数据集成和关键任务应用。

2024-05-12 13:03:21 606 1

原创 java/scala 连接mysql和redis

rpush users "4,hh,2023-01-20" 插入到尾部。lpush users "3,wz,2023-02-20" 插入到头部。//获取查询的结果并存放到list集合中。//获取redis中集合的长度。//获取connection。//获取数据并填充到集合中。//创建集合存储查询结果。//创建集合存储查询结果。//获取connection连接。//获取数据库连接对象。`scala连接redis数据库`//获取数据并填充到集合中。//准备空集合存储数据。//循环写入到集合中。

2024-04-23 13:53:54 663

原创 Flume流程详细总结

在了解Flume之前先看Flume的定义,从中了解Flume能够给我们带来什么帮助<定义Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传 输的系统。Flume 基于流式架构,灵活简单。高可用的,高可靠的如果 学习过hadoop或者大数据相关的知识,我们经常能够看到这两个名词,前者能够保证系统在各种故障的时候任然能够保持运行,后者能够保证系统稳定的运行,使得系统不容易发生故障。海量日志采集、聚合和传输。

2024-01-18 14:56:45 1327 1

原创 Yarn工作流程

本篇文章是我使用平板画的一张Yarn工作流程。

2023-12-05 21:57:01 390 1

原创 排序算法之归并排序

这样的化1和7就会从头插入,就会覆盖掉6和10所以循环里j要加上left 对于6和10 left为0。我们设置一个临时数组用来存放临时排序后的值,注意排序完成后我们得到一个temp={6,10}的数组。if(Array[s1] <= Array[s2]){//稳定排序的关键。if(Array[s1] <= Array[s2]){//稳定排序的关键。左侧10的下标是left 也是mid 右侧6的下标是mid+1 也是right。

2023-09-07 23:13:10 79 1

原创 MyBatis配置与基础操作

属性id一定要和接口中的名一样,然后 参数类型parameterType 如果参数是一个类,那就存放类的路径,如果是int...就直接放int,对于String要放java.lang.String。接下来配置实体类文件,因为表不只有一个,所以以后实体类也不只有一个,所以我们创建一个目录来存放实体类文件。首先在mapper 里的namespace="..."里面放的是我们写的接口的路径。对于参数,主要是看操作,例如插入操作我们需要给每一个字段插入数据,就传一个对象。//利用读取的文件生成工厂。

2023-08-10 17:22:56 127 1

原创 Mysql8之窗口函数

文章内容是关于Mysql8的窗口函数的使用,内容会结合我做到的相关题目或者结合相关业务的分析来进行写作,可能并不全但后续会进行补充.

2023-08-06 09:45:51 69

原创 JDBC简介

普通执行SQL语句 Statement stmt=conn.createStatement//获取执行对象stmt.executeUpdate(sql):执行DML(对数据增删改),DDL(表/库的曾增删改查)返回值:int类型的值表示DML语句影响的行数stmt.executeQuery(sql):执行DQL(数据的查询)返回值:ResultSet 结果集对象以DDL为例测试第一种,结果用count接收表示被影响的行数。

2023-07-23 20:10:51 50 1

原创 static/final/abstract 3个修饰符的总结

访问修饰符+abstract+类型+变量名(abstract和访问修饰符可交换位置)抽象方法没有方法体。当类中有抽象方法时,需要将类声明为抽象类 注意abstract class顺序不能变。抽象类不能单独实例化(new 对象),但可以声明引用。abstract只能修饰类和方法,不能修饰属性。一个非抽象类继承了抽象类后必须重写父类的全部抽象方法。抽象方法不能使用private,final,static修饰。抽象类中不一定有构造方法。

2023-07-09 10:28:54 62 1

原创 Hadoop之HDFS总结

想要知道HDFS是什么,我们要先了解一下HDFS是在什么背景下产生的, 随着我们时代的不断发展,数据量也,在存不下所有的数据,像我们正常的Windows操作系统下,磁盘的空间也不是很大,当然可以扩大,但是不如分配到更多的操作系统管理的磁盘中,这样也就产生了一个问题,这么多的操作系统该如何去呢?由此我们迫切的需要一种系统来管理多台机器上的文件,这样就产生了所谓的分布式文件管理系统,而HDFS就是分布式文件管理系统中的一种。

2023-06-02 23:55:42 365

原创 BigInteger的用法

最近在做题的过程中经常遇到大数的阶乘求和,所以想总结一下java中BigInteger的用法。

2023-05-19 12:40:21 2006 1

原创 java代码块

java类的五大成员分别是属性、方法、构造器(构造函数)、代码块、内部类本篇文件将向大家介绍其中之一的代码块。

2023-04-22 15:11:33 2312

原创 IO流的总结

文件 ,这个我们并不陌生的词汇,是 保存数据的地方 ,它可以保存图片,视频等等。

2023-04-17 23:36:17 88 1

原创 java集合学习总结

java集合的总结。

2023-04-01 11:50:54 225

原创 String类

对java中String类的理解。

2023-03-26 14:58:44 138 1

原创 对java包装类的学习

对于java中包装类的总结.

2023-03-25 14:38:46 96

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除