自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 收藏
  • 关注

原创 jdk锁知识(八)—— Semaphore(0)

semaphore(0)使用场景和机制

2024-04-14 11:57:45 461

原创 代理模式简单demo(java)

代理模式本质上的目的是为了增强现有代码的功能,其分为静态代理和动态代理两种。静态代理,代理类需要运行前编写代码实现。动态代理,代理类在运行中生成,常用的动态代理实现方式有jdk和cglib。

2023-12-02 15:54:19 1599

原创 mybatis源码(五)springboot pagehelper实现查询分页

分页插件什么时候被加载的、分页插件什么时候生效的,如何生效的

2023-12-02 11:53:28 2547

原创 离线环境通过脚本实现服务器时钟同步(假同步)

离线环境通过脚本实现服务器时钟同步

2023-11-10 08:57:03 1847

原创 h264文件提取一帧帧数据

java从h264视频文件提取一帧帧的数据

2023-11-08 21:40:56 609

原创 java获取近期视频流关键帧与截图

自定义环形缓存区实现近期视频流关键帧提取和近期视频截图功能

2023-11-08 10:14:00 1422

原创 tcp字节传输(java)-自定义包头和数据识别

tcp字节传输(java)-自定义包头和数据识别,指定长度数据包拼接2.

2023-09-07 19:22:47 1053

原创 hdfs滚动升级(rollingUpgrade )

hdfs滚动升级namenode和datanode

2023-09-01 16:05:15 332

原创 mysql采样查询

mysql针对大量数据进行采样查询

2023-07-26 21:08:10 663

原创 MongoTemplate手动动态创建(简版)

手动动态创建mongoTemplate

2023-07-02 12:00:19 659

原创 HiveMetaStore: Not authorized to make the get_current_notificationEventId call.

HiveMetaStore: Not authorized to make the get_current_notificationEventId call.You can try to disable metastore.metastore.event.db.notification.api.authMetaException: User work is not allowed to perform this API call.

2023-06-04 09:08:36 922

原创 spark sql(四)物理计划解析

spark sql物理计划执行流程解析

2023-05-28 10:38:50 1139

原创 spark sql(七)源码解析 - sparksql什么时候将时间类型转换成整型或者长整型,又是什么时候将整型或长整型转为时间类型?

sparksql什么时候将时间类型转换成整型或者长整型,又是什么时候将整型或长整型转为时间类型?

2023-04-02 13:48:26 624 1

原创 spark sql(六)sparksql自定义数据源

sparksql通过DataSourceRegister查找规则实现自定义hbase数据源

2023-03-19 00:49:28 1471

原创 hbase regionserver与hbck端口冲突

hbase regionserver与hbck端口冲突问题定位和解决

2023-03-04 11:46:31 401

原创 spark sql(五)sparksql支持查询哪些数据源,查询hive与查询mysql的区别

sparksql支持查询的数据源类型,以及查询mysql和查询hive的源码过程简析

2023-03-04 11:10:44 2891 1

原创 spark sql(三)逻辑计划解析(analyzer)

简单探究spark sql中analyzer解析库表的源码

2023-03-04 11:10:08 754

原创 spark sql(二)sql解析流程扩展

spark sql大体在四个阶段提供了扩展能力,分别是未解析的逻辑计划、解析后的逻辑计划、优化后的逻辑计划、物理计划。在这四个阶段后面我们都可以引入自己的处理逻辑。

2023-03-04 11:09:27 705

原创 spark sql(一)源码分析sql解析流程

spark sql解析sql主要基于Catalyst框架,它将复杂的sql解析分为很多的阶段,如未解析的逻辑计划、解析后的逻辑计划、优化后的计划、物理计划等阶段,且每个阶段都有专门的工具类进行处理。

2023-03-04 11:08:49 1206

原创 spark sql(零)总体介绍

spark sql整体功能以及源码流程和功能扩展介绍

2023-03-04 11:06:22 606

原创 java嵌入式安装

通过jar包实现软件的一键安装部署

2023-02-18 13:09:58 475

原创 hdfs(二)高可用单NameNode从standby恢复为active

将高可用hdfs ha降为单namenode可行。如果两个namenode有一个不能用了,紧急情况下就可以通过修改配置的方式将hdfs降低为单namenode的集群继续进行工作。

2023-01-22 18:50:45 2142 1

原创 hdfs(一)高可用单NameNode从standby恢复为active

hdfs ha集群中,通过新增namenode节点解决单namenode损坏导致集群处于standby状态问题

2023-01-22 16:45:40 1652

原创 hive(二)表 desc 描述元信息获取(java hive jdbc)

java hive jdbc一次性获取hive表数据在hdfs中的location位置、或者获取hive的文件存储格式、使用的压缩算法,甚至是表中的字段类型、字段注释、字段约束、表中是否有数据、数据大小、文件数等信息。

2022-12-09 21:44:51 4122 1

原创 hue(一)编译、启动、使用

hue编译了解、踩坑识别

2022-11-20 17:31:40 2466

原创 doris(一)单节点部署

doris单节点FE BE快速部署

2022-10-16 11:06:17 3675 1

原创 sparksql(一) insertinto 源码解析

sparksql insertinto 源码解析

2022-09-03 17:24:10 3636

原创 spark源码(七)RDD cache、persist、checkpoint功能区别和源码解析

RDD cache、persist、checkpoint功能区别和源码解析

2022-07-17 21:10:56 884 3

原创 kylin(五)开启dashboard监控面板

kylin开启dashboard监控面板和相关的度量监控数据

2022-07-16 20:12:04 1086 1

原创 druid + presto报错:java.sql.SQLFeatureNotSupportedException: Batches not supported

druid + presto报错:java.sql.SQLFeatureNotSupportedException: Batches not supported

2022-07-16 07:20:21 963

原创 spark源码(六)spark如何通过BlockManager控制数据的读写

BlockManager三大读写模块:MemoryStore:负责内存数据的读写;DiskStore:负责磁盘数据的读写;BlockTransferService:负责远程数据的读写

2022-07-11 22:36:06 1367

原创 spark源码(零)阅读总纲

系统了解spark任务的提交,driver、application的调度与注册,资源的分配,executor的创建,job到stage再到task的切分过程,hdfs文件数据的读写操作,RDD本身的map reduce操作,持久化、check point的高可靠性容错性的实现等。............

2022-06-25 11:03:20 584

原创 spark源码(五)DAGScheduler TaskScheduler如何配合提交任务,application、job、stage、taskset、task对应关系是什么?

DAGScheduler TaskScheduler如何配合提交任务,各个阶段如何划分?一个application可能有多个job提交,因为每个行为算子都调用runjob方法,即都对应一次job任务提交一个job可能有多个stage,划分依据主要是RDD是不是出现了shuffle,即每个宽依赖都会导致新stage的生成。一个stage对应一个taskset,且为stage中每个分区创建一个task任务。askset包含一组task,每个task执行逻辑相同,主要是面向stage不同的分区...

2022-06-25 10:58:49 458

原创 spark源码(四)executor在worker上的创建过程,executor本质是什么,是线程池吗?

executor在worker上的创建过程,executor执行task的本质是提交任务到缓冲线程池

2022-06-19 20:29:39 694

原创 spark源码(三)spark 如何进行driver、executor任务的调度,以及executor向driver的注册

spark 如何进行driver、executor任务的调度,以及executor向driver的注册

2022-06-19 10:20:48 1248

原创 spark源码(二)spark如何启动driver、application注册、executor构建命令拼装

driver概念解析、driver运行、application注册、executor构建命令拼装

2022-06-18 11:54:29 1350

原创 spark源码(一)spark-submit如何将jar以及配置参数提交给spark服务器

spark-submit提交任务给spark服务器

2022-06-12 18:47:57 2852

原创 IDEA远程调试spark-submit提交的jar

IDEA远程debug spark-submit提交的jar

2022-06-12 10:12:49 890

原创 excel条件格式使用详细步骤

excel条件格式使用详细步骤

2022-06-05 08:36:23 5724

原创 sparksql查询hive表报错:codec com.hadoop.compression.lzo.LzoCodec not found 问题探究

Caused by: java.lang.ClassNotFoundException: Class com.hadoop.compression.lzo.LzoCodec 问题探究

2022-05-23 22:02:33 1250

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除