GreenPlum学习总结

本文详细记录了在CentOS7.5环境下安装GreenPlum 6.0.13的过程,包括硬件与软件环境配置、内核参数调整、selinux与防火墙设置、数据库初始化、远程访问配置等步骤。同时,文章提到了一些性能优化参数,如全局死锁检测和禁用GPORCA优化器,并分享了GreenPlum的基本架构知识。
摘要由CSDN通过智能技术生成

一、测试环境

1.硬件环境:

集群版
操作系统:CentOS Linux release 7.5.1804 (3台)
内存大小:16G
磁盘大小:500G
CPU型号:8核(Intel® Xeon® CPU E5-2670 0 @ 2.60GHz)

2.软件环境:

软件版本节点
gp 集 群greenplum-db-6.0.13-rhel7-x86_64.rpmmaster主机不存放数据,两个sdw各两个节点一共四个segment(主节点+镜像节点)

点击这里官网下载

二、安装步骤

1.安装greenplum

1.创建用户和组gpadmin

sudo groupadd -g 530 gpadmin #创建用户组
sudo useradd -g 530 -u 530 -m -d /home/gpadmin -s /bin/bash gpadmin #创建用户,并指定路径
passwd gpadmin #创建用户密码

2.配置内核参数,添加如下内容:

vi /etc/sysctl.conf

#By greenplum
net.ipv4.ip_forward = 0
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 1
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.sem = 250 64000 100 512
kernel.shmmax = 500000000
kernel.shmmni = 4096
kernel.shmall = 4000000000
kernel.sem = 250 64000 100 512
net.ipv4.tcp_tw_recycle=1
net.ipv4.tcp_max_syn_backlog=4096
net.core.netdev_max_backlog=10000
vm.overcommit_memory=2
net.ipv4.conf.all.arp_filter = 1
# 以上参数可以根据自己系统配置做适当修改
# 手工执行命令,让参数生效
sysctl -p

3.安装之前先关闭selinux和防火墙,以后要开防火墙,可以只允许gp数据库端口即可

关闭、开启防火墙
systemctl start firewalld.service#启动firewall
systemctl stop firewalld.service#停止firewall
systemctl disable firewalld.service#禁止firewall开机启动
systemctl enable firewalld.service#允许firewall开机启动
 
关闭selinux
sed -i '/SELINUX/s/enforcing/disabled/' /etc/selinux/config
改完后重启

开启防火墙,预留gp端口
firewall-cmd --zone=public --permanent --add-port=5432/tcp
重载服务
firewall-cmd --reload
检测端口是否开启
firewall-cmd --query-port=5432/tcp

4.在limits.conf文件中添加如下限制参数

vi /etc/security/limits.conf

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

5.修改每个机器的hostname

vi /etc /hostname
hostnamectl set-hostname mdw(永久强制修改)

6.配置地址别名

在每个节点执行下面的操作。通过 vi /etc/hosts来进行编辑:

10.15.20.110  mdw
10.15.20.111  sdw1
10.15.20.112  sdw2

7.配置ssh直接访问

在mdw节点,切换用户为gpadmin:gpadmin,接下来的操作是要在gpadmin的权限下进行。

su gpadmin
ssh-keygen (一路回车)
ssh-copy-id sdw1
ssh-copy-id sdw2

8.安装greenplum集群

#安装gp软件
su - root
cd /usr/local/
sudo dpkg -i greenplum-db-6.13.0-ubuntu18.04-amd64.deb
#修改gp安装目录权限
chown -R gpadmin:gpadmin /usr/local/greenplum-db*

9.在所有节点执行下面的操作:

mkdir -p /data/greenplum_data/primary
mkdir -p /data/greenplum_data/mirror
mkdir -p data/greenplum_data/gpmaster
chown -R gpadmin:gpadmin /data/   # 给实例目录授权

10.初始化环境(!!!!!一下操作只在mdw节点进行即可

(1)登录gpadmin用户执行脚本。

su gpadmin
. /usr/local/greenplum-db-6.13.0/greenplum_path.sh

(2)编辑gpinitsystem_config文件(参考的是/usr/local/greenplum-db-6.13.0/docs/cli_help/gpconfigs/gpinitsystem_config 这里建议自己生成)

vi gpinitsystem_config

# 数据库的代号
ARRAY_NAME="Greenplum Data Platform"
# 数据库的数据节点名称文件
MACHINE_LIST_FILE=./hostfile_segments
# 指定Primary Segment的数据目录
declare -a DATA_DIRECTORY=(/data/greenplum_data/primary /data/greenplum_data/primary)  #一台机器几个节点建立几个文件
# Master 所在机器的Hostname
MASTER_HOSTNAME=mdw 
# 指定Master的数据目录                      					    
MASTER_DIRECTORY=/data/greenplum_data/gpmaster
# Segment的名称前缀               
SEG_PREFIX=gpseg												
# Primary Segment骑士的端口号
PORT_BASE=6000
# Master的端口
MASTER_PORT=5432
# Mirror Segment起始的端口号
MIRROR_PORT_BASE=43000
# Primary Segment 主备同步的起始端口号
REPLICATION_PORT_BASE=34000
#Mirror Segment主备同步的起始端口号
MIRROR_REPLICATION_PORT_BASE=44000
# Bash版本
TRUSTED_SHELL=ssh
CHECK_POINT_SEGMENTS=8
# 字符集
ENCODING=UNICODE
# Mirror Segment的数据目录
declare -a MIRROR_DATA_DIRECTORY=(/data/greenplum_data/mirror /data/greenplum_data/mirror)
# 初始化数据库名称
DATABASE_NAME=postgres

(3)编辑hostfile_allhosts
这个文件包含你所有的节点。

mdw
sdw1
sdw2

(4)编辑hostfile_segments
这个文件包含你所有的数据节点。我的mdw节点不存放数据,故不当数据节点。

sdw1
sdw2

(5) 配置 .bash_profile 环境变量

vi /home/gpadmin/.bash_profile

source /usr/local/greenplum/greenplum-db-6.13.0/greenplum_path.sh
export MASTER_DATA_DIRECTORY=/data/greenplum_data/gpmaster/gpseg-1
export PGPORT=5432

• 使之生效

 source /home/gpadmin/.bash_profile

(6)初始化集群

gpinitsystem -c /home/gpadmin/gpinitsystem_config

到这里就安装完成了!!!!
11.开启远程访问数据库(mdw节点)

vi /data/greenplum_data/gpmaster/gpseg-1/pg_hba.conf
host     all         all         0.0.0.0/0     trust      #加在文件最后

12.访问数据库

psql -p 5432 postgres

2.安装pgAdmin4 (选择性安装)

gp专用数据库管理软件

  1. 官网下载
  2. 安装步骤
  3. pgAdmin4 汉化

三、常用命令

1.配置

gpstop -u                   #在不停止集群情况下,修改reload配置文件
gpstate –m | -e             # 查看集群状态
gpstop –a –r         	    # 重启集群
gpstop –a  					# 重启集群

2.使用

GreenPlum 集群常用命令
GreenPlum 数据库操作常用命令
GreenPlum 集群常用命令

四、insert性能优化

调整的参数如下:
(1)全局死锁检测开关
在Greenplum 6中其默认关闭,需要打开它才可以支持并发更新/删除操作;
gpconfig -c gp_enable_global_deadlock_detector -v on

(2) 禁用GPORCA优化器(据说GPDB6默认的优化器为:GPORCA)    **查询时开启**
gpconfig -c optimizer -v off

(3)关闭日志
此GUC减少不必要的日志,避免日志输出对I/O性能的干扰。
gpconfig -c log_statement -v none
greenplum 6.13.0测试结果
默认参数1w / 46468ms
调成后参数1w / 3764ms

五、体系架构初学习

  1. Greenplum介绍
  2. 镜像介绍>>>>>>>>segment 镜像机制详解>>>>>>>>添加镜像步骤
  3. Greenplum扩容节点步骤
  4. 分布键学习

参考链接:

https://www.jianshu.com/p/3aa44b38e3af
https://www.cnblogs.com/scoter2008/p/5928972.html
https://www.cnblogs.com/FreeFire/p/13298076.html
https://blog.csdn.net/u012878005/article/details/81237602

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值