Ubuntu下安装conda和superset
Apache Superset 是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘
Superset 官网地址:http://superset.apache.org/
一、介绍
在安装Superset之前,要转备好安装环境,Supetset是用python开发的,对python要求的版本是3.7+,但是对于ubuntu来讲,其实是自带python的,只是自带的ptython版本是2.7,其实我们可以将机器的python卸载安装成3.7,类似于python升级,但是为了以后某些不知名的场景中又使用到python2.7的可能,所以我们选择使用miniconda来安装python3.7
conda 是一个开源的包、 环境管理器, 可以用于在同一个机器上安装不同 Python 版本的软件包及其依赖,并能够在不同的 Python 环境之间切换,Anaconda 包括 Conda、Python 以及一大堆安装好的工具包,比如:numpy、pandas 等,Miniconda 包括 Conda、Python。
二、安装 Miniconda
1 )下载 Miniconda (Python3 版本)
下载地址:https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
2)执行以下命令进行安装,并按照提示操作,直到安装完成。
bash Miniconda3-latest-Linux-x86_64.sh
在安装的过程过程中会让进行一些操作
安装成功会出现以下信息
安装成功之后,终端就发生了如下变化
Miniconda 安装完成后,每次打开终端都会激活其默认的 base 环境,我们可通过以下命令,禁止激活默认 base 环境。
conda config --set auto_activate_base false
三、创建python3环境
1:配置 conda 国内镜像
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
2:创建 Python3.7 环境
conda create --name superset python=3.7
3:conda 环境管理常用命令
创建环境:
conda create -n env_name python=3.7
查看所有环境:
conda info --envs
删除一个环境:
conda remove -n env_name --all
4:激活 superset 环境
conda activate superset
检测当前python版本
5:退出当前环境
conda deactivate
四、Superset 部署
1:安装依赖
安装 Superset 之前,需安装以下所需依赖
sudo apt install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel python-setuptools openssl-devel cyrus-sasl-devel openldap-devel
2:安装 Superset
1 )安装(更新)setuptools 和 pip
pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/
说明:pip 是 python 的包管理工具,可以和 centos 中的 yum 类比 ,和ubuntu中的apt类比
2 ) 安装 Supetset
pip install apache-superset -i https://pypi.douban.com/simple/
说明:-i 的作用是指定镜像,这里选择国内镜像
注:如果遇到网络错误导致不能下载,可尝试更换镜像
pip install apache-superset --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple
3 )初始化 Supetset 数据库
superset db upgrade
4 )创建管理员用户
export FLASK_APP=superset
superset fab create-admin
说明:flask 是一个 python web 框架,Superset 使用的就是 flask
5 )Superset 初始化
superset init
3:启动 Supterset
1 )安装 gunicorn
pip install gunicorn -i https://pypi.douban.com/simple/
说明:gunicorn 是一个 Python Web Server,可以和 java 中的 TomCat 类比
2 ) 启动 Superset
(1 ) 确保当前 conda 环境为 superset
(2 ) 启动
gunicorn --workers 5 --timeout 120 --bind localhost:8787 "superset.app:create_app()" --daemon
说明:
–workers :指定进程个数
–timeout :worker 进程超时时间,超时会自动重启
–bind :绑定本机地址,即为 Superset 访问地址
–daemon :后台运行
(3 ) 登录 Superset
访问 http://localhost:8787,并使用 创建的管理员账号进行登录。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ml6IxN28-1632303362853)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210922173304446.png)]
3 ) 停止 superset
ps -ef | awk '/superset/ && !/awk/{print $2}' | xargs kill -9
4:superset 启停脚本
在家目录下的用户的bin目录下新建文件superset.sh文件
#!/bin/bash
superset_status(){
result=`ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | wc -l`
if [[ $result -eq 0 ]]; then
return 0
else
return 1
fi
}
superset_start(){
source ~/.bashrc
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
conda activate superset ; gunicorn --workers 5 --timeout 120 --bind localhost:8787 --daemon 'superset.app:create_app()'
else
echo "superset 正在运行"
fi
}
superset_stop(){
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
echo "superset 未在运行"
else
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
fi
}
case $1 in
start )
echo "启动 Superset"
superset_start
;;
stop )
echo "停止 Superset"
superset_stop
;;
restart )
echo "重启 Superset"
superset_stop
superset_start
;;
status )
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
echo "superset 未在运行"
else
echo "superset 正在运行"
fi
esac
保存退出,赋予执行权限
chmod +x superset.set
就可以使用了