自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(197)
  • 收藏
  • 关注

原创 MySQL的主从复制

主从复制是指将主数据库的DDL 和DML操作通过二进制日志传到从库服务器中,然后再从库上对这些日志重新执行(也叫重做),从而使得从库和主库的数据保持同步。MySQL支持一台主库同时向多台从库进行复制,从库同时也可以作为其他从服务器的主库,实现链状复制。

2024-04-18 17:33:05 1020 1

原创 msyql中的四大日志

慢查询日志记录了了所有执行时间超过参数long_query_time设置值并扫描记录不小于min_examined_row_limit的所有sql语句的日志,默认未开启。错误日志是MySQL中最重要的日志之一,它记录了当MySQL启动和停止时,以及服务器子啊运行过程中发生任何严重错误时的相关信息。查询日志中记录了客户端的所有操作语句,而二进制日志不包含查询数据的sql语句。默认情况下,查询日志是未开启的。该日志是默认开启大的,默认存放目录/var/log/,默认的日志文件名问mysql.log。

2024-04-17 18:18:33 616

原创 MySQL中的事务

事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。默认MySQL的事务是自动提交的,也就是说,当执行一条DML语句,Mysql会立即隐式的提交事务。

2024-03-11 18:27:32 581 1

原创 mysql的多表查询

概述:指从多张表中查询数据笛卡尔积:笛卡尔积是指在数学中,两个集合A和集合B所有的组合情况(在多表查询中,需要消除无效的笛卡尔积)

2024-03-11 16:30:05 1007

原创 MySQL中的一些基础函数

函数指的是一段可以直接被另一段程序调用的程序或代码。

2024-03-06 14:27:34 487

原创 DQL相关操作(很详细!!!)

注意:如果是多字段排序,当第一个字段值相同时,才会根据第二个字段进行排序。select 聚合函数(字段列表) from 表名;DQL是数据查询语言,用来查询数据库中表的记录。1.介绍:将一列数据作为一个整体进行纵向运算。注意:null值不参与所有聚合函数运算。2.where和having的区别。查询关键字:select。别名增强可读性,可有可无。

2024-03-05 20:10:58 486

原创 DML相关操作

DML是数据操作语言,用来对数据库中表的数据记录进行增删改操作。

2024-03-05 17:56:49 351

原创 DDL相关操作

查询查询所有数据库查询当前数据库创建删除使用USE 数据库名;

2024-03-05 15:23:33 576

原创 docker搭建Redis三主三从

请确保在运行该命令之前已经启动了六个对应的 Redis 容器,并且这些容器处于可访问的状态。此外,还需要注意集群的配置和部署步骤,以确保正确设置 Redis 集群。

2023-09-26 13:27:42 341

原创 分布式算法相关,使用Redis落地解决1-2亿条数据缓存

为了在结点数目发生改变时尽可能少的迁移数据将所有的存储接地点配列在首尾相接的hash环上,每个可以在计算hash后会顺时针找到临近的存储点存放。而当有结点加入或退出时仅影响该节点在hash环上顺时针相邻的后续结点优点:加入和删除只影响哈希环中顺时针方向的相邻的节点,对其他节点无影响缺点:数据的分布和节点位置有关,因为这些节点不是均匀分布在hash环上的,所以数据在进行存储时达不到均匀分布的效果。

2023-09-25 16:10:50 352

原创 docker实现mysql主从复制(巨详细!!!)

综合上述参数,该命令会创建一个名为 mysql-master 的 MySQL 5.7 数据库容器,并将其映射到主机的 3307 端口,同时将容器中数据库的日志文件、数据文件和配置文件挂载到主机上指定的目录。容器中的 MySQL 数据库的 root 用户密码将被设置为 ROOT。综合上述命令,第一个命令创建了一个名为 ‘slave’ 的用户,并设置其密码为 ‘123456’,允许从任何主机连接。这是两个 MySQL 数据库命令用于创建一个名为 ‘slave’ 的用户,并授予该用户复制从库和复制客户端的权限。

2023-09-24 21:25:44 450

原创 docker镜像相关

docker中的镜像分层,支持通过扩展现有镜像,创建新的镜像。自己再按需扩展。新镜像是从base镜像一层一层叠加生成的。没安装一个新的软件,就在现有镜像的基础上增加一层。

2023-09-20 19:13:25 175

原创 docker一些基础的命令

–name=“容器新名字” ,为指定容器指定一个名字-d:后台运行容器并返回一个容器ID,即启动守护式容器(后台运行)-i:以交互模式运行容器,通常与-t同时使用-t:为容器重新分配一个伪输入终端,通常与-i同时使用,即启动交互式容器(前台有伪终端,等待交互)-P:随机端口映射-p:指定端口映射-a:列出当前所有正在运行的容器+历史运行过的-l:显示最近创建的容器-n:显示最近n个创建的容器-q:静默模式,只显示容器编号退出容器:有两种方式:exit:run进去容器,exit退出,容器停止ctrl+p+

2023-09-20 14:25:20 363

原创 HDFS中snapshot快照机制

snapshot是数据存储的某一时刻的状态记录,备份(backup)则是数据存储的某一个时刻的副本HDFS snapshot快照是整个文件系统或某个目录在某个时刻的镜像,该镜像并不会随着源目录的改变而进行动态的更新。

2023-08-08 18:05:44 1078

原创 HDFS中的Trash垃圾桶回收机制

HDFS Trash机制,目的防止无意中删除某些东西。默认情况下是不开启的启用Trash功能之后,从HDFS中删除某些内容时,文件或目录不会立即被清楚,他们将被移动到回收站Current目录中(/user/${username}.Trash/current).Trash中的文件在用户可配置的时间延迟后被永久删除也可以简单的讲回收站里的文件移动到.Trash目录之外的位置来恢复回收站中的文件和目录。

2023-08-08 15:58:50 1407

原创 HDFS中的sequence file

sequence file是hadoop提供的一种二进制文件存储格式一条数据称之为record(记录),底层直接以键值对形式序列化到文件中。

2023-08-06 00:26:52 1215

原创 HDFS小文件解决方案---archive归档文件命令

hadoop archive可以有效地处理以上的问题,它可以把多个文件归档成为一个文件,归档成一个文件后还可以透明的访问每一个文件。

2023-08-05 23:55:12 971

原创 HDFS中的NAMENODE元数据管理(超详细)

文件自身属性信息文件名称、权限、修改时间,文件大小、复制因子、数据块大小文件块位置映射信息记录文件块和DataNode之间的映射信息,即哪个块位于哪个结点上按照存储形式分别为内存元数据和元数据文件两种,分别存在内存和磁盘上SNN可以减小edits logs文件的大小和得到一个最新的fsimage文件,这样也会减小在namenode上的压力。

2023-08-05 19:48:13 3245

原创 HDFS架构刨析

HDFS是Hadoop distribute file system的简称,意味:Hadoop分布式文件系统HDFS是Hadoop核心组件之一,作为大数据生态圈最底层的分布式存储服务而存在HDFS解决的问题就是大数据如何存储,它是横跨在多台计算机上的文件存储系统并且具有高度的容错能力HDFS遵循主从架构namenode是主节点,负责存储和管理文件系统元数据信息,包括namespace目录结构,文件块位置信息等datanode是从节点,负责存储文件具体的数据块。

2023-08-03 11:21:32 879

原创 HDFS集群滚动升级以及回滚相关

在hadoop v2中,HDFS支持namenode高可用(HA),使得不停机升级HDFS变的可行。注:从hadoop2.4.0开始才支持滚动升级因此为了在不停机的情况下升级hdfs集群,必须使用HA设置集群在HA集群中,有两个或多个namenode,许多DataNode,一下journalnode和一下zookeepernodeJN相对稳定,在大多数情况下,升级HDFS时不需要升级滚动升级过程中,仅针对NNS和DNS,JNS和ZKNS都没有,升级JN和ZKN可能会导致集群停机。

2023-08-02 00:24:21 1459

原创 HDFS中的Federation联邦机制

命名空间(namespace)由文件,块和目录组成的统一抽象的目录树结构。由namenode根据用户操作实时维护树结构块存储层包括两部分:块管理:namenode执行块管理。块管理通过处理注册和定期心跳来提供DataNode集群成员身份。它处理块报告并迟滞与块相关的操作,如创建,删除,修改或获取块位置。它还维护块的位置,副本位置。为未复制的块管理块复制,并在已复制的块中删除存储:DataNode通过在本地文件系统上存储块并提供读/写访问权限来管理存储空间。

2023-08-01 23:46:09 1304

原创 HDFS的QJM方案

Quorum Journal Manager(仲裁日志管理器),是Hadoop官方推荐的hdfs HA解决方案之一使用zookeeper中ZKFC来实现主备切换使用Journal Node(JN)集群来实现edits log的共享以达到数据同步的目的。

2023-08-01 22:52:40 1775

原创 HDFS集群黑白名单机制

HDFS集群黑白名单机制白名单黑名单白名单所谓白名单指的是允许哪些机器加入到当前的HDFS集群中,是一种准入机制白名单由dfs.hosts参数指定,该参数位于hdfs-site.xml.默认值为空dfs.hosts只想文件,该文件包含允许链接到namanode的主机列表。必须允许指定文件的完整路径名。如果该值为空,则允许所有主机接入黑名单所谓黑名单指的是禁止哪些主机加入到当前的HDFS集群中,是一种禁入机制黑名单由dfs.hosts.exclude参数指定,该参数位于hdfs-site.

2023-08-01 09:00:00 196

原创 HDFS Erasure coding-纠删码介绍和原理

纠删码技术简称EC,是一种编码容错技术。最早用于通信行业,数据传输中的数据恢复。它通过对数据进行分块,然后计算出校验数据,是的各个部分的数据产生关联性。当一部分数据块丢失时,可以通过剩余的数据块和校验块计算出丢失的数据块Hadoop3.0之后引入了纠删码技术,它可以提高50%以上的存储利用率,并且保证数据的可靠性。

2023-07-31 22:08:13 942

原创 磁盘均衡器:HDFS Disk Balancer

hdfs disk balancer是hadoop3中引入的命令行工具,用于平衡DataNode中的数据在磁盘指甲分布不均匀问题。在这里特别注意,hdfs diskbalancer与hdfsbalancer是不同的。

2023-07-31 21:24:06 1800

原创 HDFS高阶优化方案:短路本地读取,节点负载平衡器

Unix domain socket通常被用于本地进程间的通信需求,如某个进程提供服务,其他进程通过Unix domain socket与之进行通信。Unix domain socket(Unix域套接字)是一种用于进程间通信的机制,特别适用于同一台计算机上的进程间通信。这是一种进程间的通讯方式,它使得同一个机器上的两个进程能以socket的方式通讯。总结起来,Unix domain socket是一种本地进程间通信的机制,具有高性能、安全性好,适用于同一台计算机上的进程间通信需求。

2023-07-31 12:00:00 329

原创 HDFS中namenode安全模式

hadoop中的安全模式safe mode是namenode的维护状态,在此状态下namenode不允许对文件系统进行任何更改,可以接受读数据请求在namenode启动过程中,首先会从fsimage和edits日志文件加载文件系统状态。然后,等待datanodes汇报可用的block信息。在此期间,namenode保持在安全模式。随着DataNode的block汇报持续进行,当整个系统达到安全标准时候,HDFS自动离开安全模式。在namenode web主页上会显示安全模式是打开还是关闭。

2023-07-29 18:23:40 1310

原创 HDFS中数据迁移的使用场景和考量因素

这个命令告诉distcp工具将hdfs://src_cluster:8020/user/data目录下的数据复制到hdfs://dest_cluster:8020/user/data_backup目录下。

2023-07-29 16:45:07 1699

原创 HDFS异构存储详解

异构存储是Hadoop2.6.0版本出现的新特性,可以根据各个存储介质读写特性不同进行选择。例如冷热数据的存储,对冷数据采取容量大,读写性能不高的存储介质如机械硬盘,对于热数据,可使用SSD硬盘存储。HDFS支持把数据写入由DataNode管理的对外内存DataNode异步地将内存中数据刷新到磁盘,从而减少代价较高的磁盘IO操作,这种写入被称为Lazy Persist写入该特性从Apache Hadoop 2.6.0开始支持。

2023-07-26 15:58:33 1307

原创 HDFS基本操作命令

命令:hadoop fs -getmerge [-n1] [-skip-empty-file]-p选项的行为与unix mkdir -p非常相似,他会沿着路径创建父目录。下载文件到本地文件系统指定目录,localdst必须是目录。和-put功能一样,只不过上传结束,源数据会被删除。-p保留访问和修改时间,所有圈和权限。-p保留访问和修改时间,所有权和权限。dst如果文件不存在,将创建文件。dst 目标文件系统(HDFS)-f 覆盖目标文件(已经存在)-f覆盖目标文件(已存在下)-f覆盖目标文件

2023-07-24 15:55:47 2393

原创 如何模拟实现分布式文件存储

随着存储的进行,数据文件越来越多,与之对应元数据信息也越来越多,如何让用户视觉层面感觉不到元数据的凌乱,同时也与传统的文件系统操作体验保持一致?传统的文件系统拥有所谓的目录数结构,带有层次感的namespace(命名空间),因此可以把分布式文件系统的元数据记录这一块也。副本越多,数据越安全、当然冗余也会越多、通过“不要把鸡蛋放在一个篮子里”的思想,可以把数据丢失的方向分散在各个机器上。当文件被分布式存储在多台机器之后,后续获取文件的时候如何能快速找到文件位于哪台机器上呢。,一台不够就加机器。

2023-07-24 00:08:40 464 1

原创 HDFS的设计目标和重要特性

每个文件的block大小(dfs.bloocksize).和副本系数(dfs.replication)都是可配置的。副本系数可以在文件创建的时候胡指定,也可以在之后通过命令改变。HDFS中的文件在物理上是分块存储的(block),块的大小可以通过配置参数来规定,参数位于hdfs-default.xml中:dfs.blocksize。HDFS会给客户端提供一个统一的抽象目录数,客户端通过客户端,形如:hdfs://namenode:port/dir-a/dir-b/dir-c/file.data。

2023-07-24 00:05:18 1455

原创 基本的存储架构类型

DAS存储架构也称为直连式存储(Direct-Attached Storage),存储设备是通过电缆(通常是SCSI接口电缆)直接挂到服务器总线上。DAS比较依赖操作系统来进行IO 操作。

2023-07-22 15:11:38 123

原创 Hadoop简介以及集群搭建详细过程

hadoop加群包括两个集群:hdfs集群,yarn集群两个集群逻辑上分离,通常物理上在一起两个集群都是标准的主从架构集群逻辑上分离:两个集群相互之间没有依赖,互不影响物理上在一起:某些角色今晚往往部署在同一台物理服务器上MapReduce集群呢?MapReduce是计算框架、代码层面的组件没有集群之说。

2023-07-22 09:30:00 1350

原创 hdfs的读写流程

1.client发起文件上传请求,通过rpc与namenode建立通讯,namenode检查目标文件是否已经存在,父目录是否存在,返回是否可以上传2.client请求第一个block该传输到哪些datanode服务器上3.namenode根据配置文件中指定的备份数量及副本放置策略进行文件分配,返回可用DataNode地址,如:a,b,c。

2023-07-19 16:05:55 924

原创 hadoop简介

概念优势hadoop1.x、2.x、3.x区别HDFS架构概述MapReduce结构概述HDFS,YARN,MapReduce三者关系hadoop distributed file system,简称hdfs,是一个分布式文件系统NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等DataNode(dn):在本地文件系统存储块数据,以及块数据的校验和。

2023-06-27 12:04:09 489

原创 docker ps -a命令以及容器的三种状态

docker ps -a命令用于列出所有的Docker容器,包括正在运行和已经停止的容器。CONTAINER ID:容器的唯一标识符;IMAGE:容器所使用的镜像;COMMAND:容器启动时执行的命令;CREATED:容器的创建时间;STATUS:容器的状态;PORTS:容器所使用的端口;NAMES:容器的名称。

2023-04-23 17:50:37 11818 1

原创 docker中的四种网络模式

可以通过brctl show命令查看。Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。使用host模式的容器可以直接使用宿主机的IP地址与外界通信,容器内部的服务端口也可以使用宿主机的端口,不需要进行NAT,host最大的优势就是网络性能比较好,但是docker host上已经使用的端口就不能再用了,网络的隔离性不好。

2023-04-22 18:32:53 1158

原创 docker中的Volume

​ Volume是计算机存储技术中的一个术语,用于表示一块独立的存储空间。在操作系统中,一个硬盘可以被分为多个分区,每个分区可以被格式化为一个独立的卷,这个卷就被称为Volume。Volume通常是指一个逻辑存储单元,可以是硬盘、U盘、SD卡等存储介质的一个分区,也可以是网络存储设备(如NAS)中的一个共享文件夹。每个Volume都有自己的文件系统和存储空间,可以被操作系统和应用程序用来存储和管理数据。

2023-04-21 09:43:17 585

原创 负载均衡与DNS轮询

负载均衡(Load Balancing)是一种将工作负载(Workload)分摊到多个计算资源(服务器、存储设备、网络设备等)上的技术,目的是提高系统的可用性、性能和扩展性。

2023-04-11 10:27:50 1530

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除