文章目录
一、openGauss 与 DB4AI
一直以来,数据库给人的感觉就像是一个盒子,用来装着各种数据,只有借助“外力”才能够存取数据,对数据来进行操作。DB4AI,当我听到这个概念的时候有些震惊,因为它将数据库与 AI 这两个看似不沾边的东西结合了起来,组合成了一个更为强大的技术。
一方面,AI 可以让数据库更加智能(AI4DB),例如传统的经验数据库优化技术无法满足大规模数据库实例、多样化应用以及多样化用户的高性能需求,但是基于学习的技术可以解决可以解决这个问题;另一方面,数据库技术可以优化人工智能模型(DB4AI),比如 AI 的部署问题,需要开发人员进行复杂的代码编写以及训练才能完成模型的训练,如果将 AI 的相关能力(比如数据挖掘、数据清洗、数据标记等等)集成到数据库上,就能降低人工智能使用的复杂度。
目前具有这一功能的数据库似乎还很少,而国内似乎只有华为所开源的数据库 openGauss 具备这一功能。通过在数据库内集成 AI 算法,使得 openGauss 具备原生 AI 计算引擎、模型管理、AI 算子、AI 原生执行计划的能力。当前版本的 DB4AI 支持基于SGD 算子的逻辑回归(目前支持二分类任务)、线性回归和支持向量机算法(分类任务),以及基于K-Means算子的Kmeans聚类算法。
二、DB4AI 能力简单上手
1、openGauss 的部署与安装
openGauss 的安装方式有很多种,我这里就选择最简单快捷的方法,使用 Docker 来进行安装,来简化安装过程:
① 镜像搜索
使用 docker search
命令搜索 openGauss 镜像,可以看到第一个,也就是 NAME 为 enmotech/opengauss
的镜像 STARS 最多,这里我就选择这个,这个好像也是官方推荐的 Docker 镜像。
# 镜像搜索
docker search opengauss
② 镜像拉取
接下来使用 docker pull
对刚刚我们选择的镜像进行拉取,我这里拉取 3.0.0 版本的 openGauss(目前似乎没有 3.1.0 版本的 openGauss Docker 镜像)
# 镜像拉取
docker pull enmotech/opengauss:3.0.0
输入 docker images
可以看到我们的镜像
# 镜像查看
docker images
如果你使用 Docker Desktop,也可以在其中看到
③ 运行镜像
之后使用 docker run
命令就可以来创建并运行一个容器
# 运行镜像
docker run --name opengauss -p 26000:26000 --privileged=true -d -e GS_PASSWORD=Enmo@123 enmotech/opengauss:latest
使用 Docker Desktop 的同学也可以直接点击右边的 RUN
来运行镜像。
④ 进入容器
使用 docker ps
命令查看容器 ID
# 查看镜像 ID
docker ps
使用 docker exec
命令进入容器
# 进入容器
<