Ubuntu18.04安装配置Greenplum6.*以上版本
操作环境
硬件环境
两台Ubuntu操作系统
数据库:Greenplum6.8.1
配置信息
节点 IP 内存 硬盘
mdw 192.168.31.233 16G 500G
sdw1 192.168.31.106 16G 500G
配置SSH
安装所缺的依赖
sudo apt-get install net-tools vim -y
安装SSH服务器
- 确定安装sshd
sudo apt-get install openssh-server
- 检查防火墙设置,关闭防火墙
sudo ufw disable
- 检验是否成功,运行下面的命令
ssh localhost
- 有的时候虽然成功了,但还是会出现connection refused的问题,这是,需要查看一下sshd进程是否启动,运行下面的指令查看是否有sshd进程:
ps -e | grep ssh
- 有时虽然可以看到sshd,但是还是不能连接成功,这是需要重启一下ssh
sudo service ssh restart
- 然后再次连接,并对其他三台电脑也同样方法安装ssh服务器
下载greenplum相关文件
使用root用户来执行以下命令
sudo passwd root
输入密码:111111
切换用户:su root
输入密码:111111
下载的方式有多种,可以在官网上下载,也可以使用命令下载
命令下载
将Greenplum PPA存储库添加到您的Ubuntu系统
sudo add-apt-repository ppa:greenplum/db
更新您的Ubuntu系统,以从最近添加的存储库中检索信息
sudo apt update
安装Greenplum数据库软件
sudo apt install greenplum-db
上面的命令将自动安装Greenplum数据库软件和系统上任何必需的依赖项,并将生成的软件放在/ opt目录中,下面的某些操作需要找到对应的安装目录的,所以要注意安装目录的位置
安装包安装
点击安装包进行软件安装,安装的路径为 usr/local/greenplum-6.2.1
创建专有用户(gpadmin)
使用root用户来执行以下命令
为了方便起见,我们为每一台电脑创建一个名为gpadmin的用户,和其对应的名为gpadmin的用户组。这个用户可以在客户端Navicat Premiun15进行登录连接
首先,如果电脑上之前存在gpadmin或者gpadmin用户组的话,我们应该先把他们清掉,如果不存在也不影响,因为新的系统本来就不存在该用户,只有之前创建过才会存在,才能删除,做此步操作是为了防止之前创建过该用户:
sudo groupdel gpadmin
sudo userdel gpadmin
然后重新建一个:
sudo groupadd -g 530 gpadmin
sudo useradd -g 530 -u 530 -m -d /home/gpadmin -s /bin/bash gpadmin
对文件夹进行赋权,为新用户创建密码: 111111
sudo chown -R gpadmin:gpadmin /home/gpadmin/
sudo passwd gpadmin
为其他服务器主机也创建一个用户gpadmin:gpadmin,执行同样的命令
配置地址别名
使用root用户来执行以下命令
可以通过 sudo vim /etc/hosts 来进行编辑,然后在文件末尾添加如下信息
192.168.31.233 mdw
192.168.31.106 sdw1
查看文件内容是否添加上:cat /etc/hosts
其他:在其他三台电脑上追加同样的内容
配置ssh直接访问
进行操作之前需要切换用户为gpadmin:gpadmin,我们接下来的操作是要在gpadmin的权限下进行的
- 切换用户
su gpadmin
- 在master主机上执行如下命令来生成唯一密钥(之后将会scp到另外三台电脑上)
ssh-keygen (一路回车)
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
chmod 700 ~/.ssh/
- 查看 .ssh 文件夹下是否存在生成的文件
cd ~
cd .ssh
ls
- 在master主机执行命令拷贝到sdw1节点主机上
ssh-copy-id sdw1
- 查看子节点sdw1节点主机上的 .ssh 文件夹下是否存在4个文件
cd ~
cd .ssh
ls
- 验证是否需要密码
ssh gpadmin@mdw
ssh gpadmin@sdw1
创建数据目录
使用root用户创建文件夹
在所有节点执行下面的操作,并查看是否创建成功
sudo mkdir -p /data/greenplum_data/primary
sudo mkdir -p /data/greenplum_data/mirror
sudo mkdir -p /data/greenplum_data/gpmaster
sudo chown -R gpadmin:gpadmin /data/
cd /data/greenplum_data/
ls
使用gpadmin登录后,创建环境变量
使用以下命令将Greenplum数据库软件加载到您的环境中。请注意,您应该根据Greenplum的版本选择greenplum软件目录的确切路径:
. /usr/local/greenplum-db-6.2.1/greenplum_path.sh
使用 env 查看环境是否配置,出现GPHOME就代表成功了
which gpssh
将gpinitsystem_singlenode拷贝到home文件夹下,然后查看
cp $GPHOME/docs/cli_help/gpconfigs/gpinitsystem_singlenode .
编辑相关配置文件
创建hostlist_singlenode文件,这个文件包含你所有的节点。我这里把mdw节点也加入进来了。这个节点也会当成一个数据节点,就是主节点各子节点的名称
cd ~
vim hostlist_singlenode
mdw
sdw1
vim gpinitsystem_singlenode
ARRAY_NAME=“Greenplum Data Platform”
MACHINE_LIST_FILE= ./hostfile_segments
declare -a DATA_DIRECTORY= (/data/greenplum_data/primary)
declare -a MIRROR_DATA_DIRECTORY= (/data/greenplum_data/mirror)
MASTER_HOSTNAME= mdw
MASTER_DIRECTORY= /data/greenplum_data/gpmaster
确保标注的地方的正确性
运行gpinitsystem
gpssh-exkeys -f hostlist_singlenode
好的,我们需要启动集群,让我们开始吧。运行以下命令:
gpinitsystem -c gpinitsystem_singlenode
开启远程访问
使用root用户
在mdw master节点执行。
im /data/greenplum_data/gpmaster/gpsne-1/pg_hba.conf
在文件最后加上
host all all 0.0.0.0/0 trust
reload配置文件
在不停止集群情况下,若配置文件修改,reload配置文件:
编辑文件:
vim ~/.bashrc
添加插入:
MASTER_DATA_DIRECTORY=/data/greenplum_data/gpmaster/gpsne-1
终端执行生效该配置
export MASTER_DATA_DIRECTORY
资源载入
source /home/gpadmin/.bashrc
关闭数据库
gpstop
重启数据库
gpstart
完成操作后,您可以创建数据库,登录并开始执行查询和插入数据。如下所示:
常用命令
# 查看集群状态
gpstate –m | -e
# 重启集群
gpstop –a –r
# 重启集群
gpstop –a
# psql命令行退出
/q
重启机器后需执行:
export MASTER_DATA_DIRECTORY
然后执行
gpstart
客户端工具
使用Navicat Premiun15进行连接,输入主机地址(192.168.31.233),端口为默认端口(5432),并选择要维护的数据库(demo) 用户名(gpadmin)就是所创建的用户,密码(111111)为gpadmin的登录密码
注意事项
本次安装有部分问题,能够正常的使用,但数据批量并发导入有些问题,所以又重新装了一次,请参考Greenplum一主两从集群安装配置全过程(图文并茂)