自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 基于SpringBoot+MyBatisPlus实现的外卖平台

通过该项目学习以下内容:​ SpringBoot 的搭建和使用,包括前端过滤、用户登录session保存和校验、如何从URL或请求体中或者前端回传的参数等。​ 基于MyBatisPlus框架的数据层抽象操作,包括通过Page构造分页、通过LambdaQueryWrapper 构造各种条件查询,扩展字段、关联字段的使用,以及提交的事务等。

2023-08-10 18:14:48 302

原创 Spark系列 - 5 - Saprk SQL

Spark SQL 是一种即支持SQL又支持命令式数据处理的工具,主要用于处理结构化和半结构化数据,整合SQL查询和Spark编程,通过相同的标准的连接方式连接不同的数据源,同时兼容Hive。其通过对数据的抽象实现对数据的分析处理。包括 DataFrame 和 DataSet 两种,下面详细介绍这两种抽象数据集。

2023-06-24 16:09:04 239

原创 Spark系列 - 2 - 三大数据结构

为能够进行高并发和高吞吐的数据处理,Spark封装了三大数据结构,用于不同的数据场景。包括 RDD、累加器、广播变量。下面详细介绍这三大数据结构。

2023-06-23 15:04:28 645

原创 Spark系列 - 1 - Spark 基础

本文主要记录学习的spark的基础知识,了解和熟悉spark的基本概念、原理以及架构流程。

2023-06-21 17:13:33 213

原创 Spark系列 - 3 - RDD 算子

本文主要通过实例讲解常用的RDD算子的用法。

2023-06-21 12:27:18 382

原创 GreenPlum系列-1-概述

Greenplum数据库是一种面向数据仓库应用的关系型的MPP( 大规模并行处理)数据库系统,基于PostgreSQL数据库开发。在数据存储、高并发、高可用、线性扩展、易用性等方面有明显的优势。

2023-03-30 11:11:25 1463

原创 GreenPlum系列-9-主备同步机制

这里主要讲解 Master镜像即Master 到 Standby 的同步,以及Segment镜像 即Primary 到 Mirror 的同步这两种同步机制。

2023-03-29 17:23:41 668

原创 数据仓库-1- 概述

数据仓库是一种面向商务智能活动的数据管理系统,用于分析和报告来自多个来源的结构化和半结构化数据。(内容相对空泛,后续优化)

2023-03-28 11:01:41 89

原创 MapReduce -1- 概述

本文主要了解Hadoop重要组成部分之一的分布式计算框架MapReduce。了解其架构原理以及任务处理过程。

2023-03-24 11:36:54 142

原创 YARN -1- 概述

本文主要了解hadoop重要组件之一的资源管理框架YARN,了解其原理以及提交任务的流程。

2023-03-23 16:34:22 173

原创 Hbase -1- 概述

介绍hbase相关内容,包括核心组件、架构原理等。

2023-03-22 15:21:25 145

原创 Hbase -2- 集群部署

介绍Hbase集群部署,测试故障迁移以及通过hbase shell 进行简单的表、表数据操作。

2023-03-21 11:25:16 201

原创 HDFS - 1 - 介绍

简单介绍hdfs分布式文件系统包括概念、流程、高可用原理。

2023-03-20 14:50:46 97

原创 HDFS -2- 集群搭建

介绍分布式文件系统集群搭建,包括NameNode的高可用

2023-03-19 20:35:08 263

原创 GreenPlum系列-7-资源管理

资源管理是为了限制系统中活动的SQL对资源的消耗,包括CPU、MEM、IO等资源,避免并发SQL将系统资源耗尽导致的缓慢或崩溃。常用的资源管理模式包括 资源队列、资源组。

2023-01-09 17:25:51 1101

原创 GreenPlum系列-6-表设计之存储类型、分布、分区的介绍

在实际的生产中创建表之前需要对业务需求分析,包括使用堆存储还是追加优化存储、选择行存还是列存是否需要压缩、分布键的选择、分区的使用。

2023-01-09 15:00:42 3137 1

原创 GreenPlum系列-5-角色和权限

GP数据库使用角色管理数据库权限。角色包括用户和用户组,其独立于操作系统管理的用户和用户组。另外角色被定义在数据库系统层面上,因此对数据库系统中的所有数据库都有效。

2023-01-08 15:24:58 1883

原创 GreenPlum系列-4-配置参数

基于Centos7.9 64位, greenplum 6.18,对共享内存、网络、用户限制等参数配置

2023-01-07 16:46:56 757

原创 PostgreSQL系列- 6 - PgBouncer连接池

能够缓存和PostgreSQL的连接,当有连接请求进来的时候,直接分配空闲进程,而不需要PostgreSQL fork出新进程来建立连接,以节省创建新进程,创建连接的资源消耗

2022-12-28 17:07:44 1894

原创 Gpbackup系列-1-GPBACKUP流程

Gpbackup 是专门用来做gp数据库的并行数据备份工具。这里通过对整个备份流程了解该工具的原理。

2022-06-27 19:53:54 682

原创 GreenPlum系列-3-GP集群模拟主备切换和恢复

模拟gp集群master 故障,将standby 节点切换为master节点,以及当原master节点恢复时如何还原的测试,帮助自己理解gp 集群中主从切换的过程。

2021-11-20 15:43:57 5249

原创 GreenPlum系列-2-集群安装部署(Centos7+GP6.18)

本文主要记录基于centos7 64位的gp-6.18安装部署,包括集群安装、集群切换测试、监控安装。

2021-10-07 20:50:19 1797

原创 PostgreSQL系列- 5 - 配置文件详解

对postgres配置文件进行记录。

2021-10-07 17:30:15 6131

原创 PostgreSQL系列- 4 - 核心架构

参考"postgresql 数据库内核分析" 学习pg架构

2021-10-07 17:15:03 1136

原创 PostgreSQL系列- 3- 客户端工具

主要介绍pg的客户端工具的安装、使用

2021-10-07 17:09:03 7500

原创 PostgreSQL系列- 1- 安装部署

简单的记录pg数据库的安装部署

2021-10-07 17:07:12 1417

原创 PostgreSQL系列- 2- 基础命令

最近学习Postgres,对一些基础命令进行记录。以下操作使用控制台添加新用户、新建数据库1、新建linux 系统用户useradd dbuser2、PG 操作(psql)create user dbuser with password 'dbuser'; // 创建数据库用户dbuser,并设置密码create database test003 owner dbuser; // 创建数据库 test003 ,并指定所有者为dbusergrant all privileg..

2021-10-07 16:52:18 153

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除