自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 SQL题:未完成率较高的50%用户近三个月答卷情况

这是一道牛客网上SQL进阶图库中的一道困难题目,个人花了近两个小时才通过所有用例。之所以想记录下来是因为这道题算是一个很考验基本功的题目,也不乏一些SQL中的技巧。

2024-06-20 10:21:52 311

原创 Hbase中Rowkey的设计方法

对Hbase中Rowkey的设计方法进行汇总

2024-06-05 15:42:43 491 1

原创 hive中的join操作及其数据倾斜

简要介绍了在hive中进行join操作可能遇到的若干问题

2024-05-29 16:41:36 1052

原创 hivesql如何在数据量超大时避免join操作

探讨了一种在数据量超大的情况下避免join操作的方法

2024-05-29 10:11:25 299

转载 raft算法与paxos算法相比有什么优势,使用场景有什么差异?

同时Raft协议中日志的commit(提交)也是连续的,一条日志被提交,代表这条日志之前所有的日志都已被提交,一条日志可以被提交,代表之前所有的日志都可以被提交。可以举个列子,A,B,C三台机器,C是Leader,term是3,A告诉C它们最后一个日志的序列号都是4,term都是3,那么C就知道A肯定有序列号为1,2,3,4的日志,而且和C中的序列号为1,2,3,4的日志一样,这是raft协议日志的连续性所强调的,好了那么Leader知道日志1,2,3,4已经被多数派(A,C)拥有了,可以提交了。

2024-04-09 10:37:16 59

原创 raft算法与paxos算法的差异

依照一篇博客总结了raft算法与paxos算法之间的差异

2024-04-09 10:24:42 306

原创 hadoop中hdfs的fsimage文件与edits文件

本文简要介绍了hadoop中hdfs的fsimage和edits文件的用途,并结合了实际用途进行描述

2024-04-08 20:45:49 576

原创 Flink报错:SplitFetcher thread 0 received unexpected exception while polling the records

针对报错的解决方案进行汇总,并展示我的解决方案

2024-03-27 17:12:44 929

原创 NoMatchingMethodException No matching method for class org.apache.hadoop.hive.ql.udf.UDFToString

本文主要通过一个错误提醒读者,要注意表结构与select语句各字段的一一对应

2024-03-05 16:47:45 550

原创 Redis的持久化机制

介绍了Redis的两种持久化机制RDB和AOF,对RDB和AOF的机制进行了详细描述

2024-02-16 18:49:06 1170

原创 redis键的过期删除策略

介绍了redis的三种过期删除策略,并探讨了如何使用这三种策略

2024-02-16 17:16:11 564

原创 flink中的分区、分组与分流

介绍了flink中分区、分流和分组的概念,并配上了图片与代码。

2024-01-19 09:47:25 753

原创 什么是onedata?如何使用onedata?

介绍了onedata,并讲解了onedata的实施过程

2023-12-31 21:26:26 794

原创 数据仓库如何评价数据模型的好坏

汇总了评价数据仓库中数据模型好坏的一般指标

2023-12-24 21:08:21 206

原创 什么是拉链表

本文简单介绍了拉链表

2023-12-06 18:01:02 185

原创 什么是数据倾斜

简单介绍了数据倾斜并对数据倾斜场景进行案例分析

2023-12-05 21:55:16 95

原创 数仓建模方法汇总

本文总结并介绍了四种数仓建模方法

2023-12-04 21:47:21 120

原创 星型模型和雪花模型简介及其对比

本文用通俗易懂的语言介绍了星型模型和雪花模型,并针对这两个模型进行了对比

2023-12-01 16:18:04 686

原创 neo4j的基础语法与py2neo的使用

包含了最基础的neo4j相关查询语句的使用,并简单介绍了python连接neo4j的方法

2023-11-28 11:09:29 140

原创 java中的foreach使用方法

回顾了java foreach的使用方法

2023-11-04 12:13:05 180

原创 mv: 无法获取“/opt/module/hadoop/logs/hadoop-atguigu-nodemanager-hadoop102.out.1“ 的文件状态(stat): 没有那个文件或目录

hadoop文件配置的小问题

2023-11-04 12:12:11 1627

原创 Flink中水位线的时间戳为何要减一

本文是作者对水位线为何必须减一这个问题的见解,希望借此能在编写水位线代码时能牢记减一操作

2023-11-04 11:30:06 253 2

原创 Flink中保存点(Savepoint)和检查点(Checkpoint)的区别

本文汇总了flink中保存点和检查点之间的区别和联系,并提供相应配置代码

2023-11-04 11:27:44 153

原创 flink算子的并行度设置方法

本文汇总了flink中算子并行度的所有配置方法。

2023-11-04 11:26:17 1299 1

原创 Hadoop入门之什么是YARN

如上图所示,HDFS处于YARN之外,为YARN提供应用程序所需要的数据,而YARN中可以部署很多应用,包括MapReduce HBase Spark等。通俗来讲YARN就是一个集群管理器,它可以统筹多台服务器上的资源,根据业务需要向特定应用分配资源(资源是指处理器和内存等)。Resource manager是大总管,掌管一切资源,如果有任务提交,Resource manager就会为任务分配资源。NodeManager是小总管,主要负责该节点内所有容器的生命周期的管理,监视资源和跟踪节点健康。

2023-09-24 19:54:09 59 1

原创 &字符的使用方法

本文简述了&运算符的使用方法,并给出了具体案例

2023-09-24 19:52:24 106 1

原创 Linux系统中的环境变量加载顺序

因此不管是login shell还是non-login shell,启动时都会加载/etc/profile.d/*.sh中的环境变量。这两种shell的主要区别在于,它们启动时会加载不同的配置文件,login shell启动时会加载/etc/profile,而/etc/bashrc会进入到/etc/profile.d/目录下,并寻找*.sh中的环境变量。但是只有login shell会加载/etc/profile 和~/.bash_profile。

2023-09-24 10:26:53 142 1

原创 Hadoop中HA模式和非HA模式的区别

本文简述了hadoop中,HA模式的特点。

2023-09-24 10:24:52 241 1

原创 损失函数与决策函数的区别

详细介绍了损失函数与决策函数的区别

2023-01-31 19:04:36 279

原创 什么是负采样

简要介绍什么是负采样

2023-01-31 18:59:40 525

原创 什么是注意力机制

针对刚入门深度学习,对于注意力机制不是很理解,或者希望直接了解注意力机制的同学。本文从一个现实的例子入手,形象的讲解了注意力机制的基本原理。

2023-01-31 10:58:56 161

原创 pytorch中Variable和Tensor的区别

本文简要介绍了Variable和Tensor的区别。对Variable中的常用接口和使用方法进行了介绍并附上代码。

2023-01-31 10:46:22 486

原创 神经网络模型之GRU门控循环单元

对于GRU门控循环单元进行了简单讲解

2023-01-10 19:50:34 190

原创 Anaconda常用命令

本文包含了作者常用的Anaconda命令,这些命令基本能够帮助读者操作anaconda中的虚拟环境

2023-01-10 19:42:44 191

原创 如何使Virtualbox中的虚拟机与主机相连

本文主要介绍了VirtualBox中的桥接模式,帮助读者将虚拟机和宿主机配置在同一个局域网中

2023-01-10 19:40:59 2814

原创 如何使用Pycharm连接服务器中的anaconda环境

本文帮助读者在pycharm中配置anaconda远程连接,这样方便读者在远程服务器上训练深度学习模型

2022-11-15 10:08:14 8231 2

原创 Spark是如何划分物理执行计划的

本文详细介绍了Spark生成物理执行计划的三步骤。

2022-11-08 11:06:33 907

原创 Spark中的宽依赖和窄依赖是什么

本文主要帮助读者轻松理解什么是Spark中的宽依赖和窄依赖

2022-11-02 17:17:44 444

原创 Spark系统架构(Standalone模式)

本文简单介绍了Spark框架在Standalone模式下结构,并描述各个部分的作用及特点。文章结尾同MapReduce进行了比较

2022-10-31 10:16:15 1075

原创 什么是restful,什么是rest风格

如果你是编程新手,一定会疑惑什么是restful,什么是REST风格。

2022-07-24 19:09:21 996

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除