开源、云原生且实时分析型的现代数据仓库DataBend的介绍,及其与其它开源文件存储的结合使用实例_databend功能

# 运行一个单节点的 Databend 服务
./target/release/databend-server --config-path=config.toml.example

# 或者如果你想在后台运行(daemon mode),可以加上 `--log-file` 参数指定日志文件
./target/release/databend-server --config-path=config.toml.example --log-file=/var/log/databend/server.log &

上述命令中,config.toml.example 是一个示例配置文件,你需要根据实际需求修改它。例如设置监听地址、端口、数据目录等信息。

4. 配置数据库连接

默认情况下,Databend 启动后会在本地监听 3307 端口作为 SQL 查询接口。你可以通过任何支持 MySQL 协议的客户端连接到 Databend。

mysql -h localhost -P 3307 -u root
5. 配置持久化存储 (可选)

如果你希望将数据持久化存储在某个位置(比如 S3 或 MinIO),则需要在配置文件中添加对应的存储后端,并提供相应的访问凭证。

6. 分布式部署

对于生产环境或大规模测试,你可能需要部署多节点集群。请参考 Databend 的 Kubernetes Helm Chart 或 Docker Compose 文件来搭建分布式集群。

注意事项:
  • 在正式环境中,请确保正确配置安全性相关的选项,如密码加密、访问控制等。
  • 对于持久化存储支持,Databend 可以配置为使用各种对象存储服务,包括但不限于 AWS S3、MinIO、Google Cloud Storage 等。

请查阅最新版的 Databend 文档获取详细指导和最佳实践:Databend - The Future of Cloud Data Analytics. | Databend

基于Docker安装和配置使用

atabend 提供了 Docker 镜像,使得用户可以通过 Docker 容器快速部署和运行 Databend 数据库。以下是一个使用 Docker 安装 Databend 的详细配置步骤:

1. 拉取 Databend Docker 镜像

首先,确保已安装 Docker,并在终端中执行以下命令以拉取最新的 Databend Docker 镜像。请注意,实际镜像名可能会随着版本更新而变化,请参考官方文档获取最新版本。

docker pull databend-docker:databend-query # 查询引擎(databend-query)
docker pull databend-docker:databend-meta # 元数据服务(databend-meta)
2. 创建用于持久化存储的目录(可选)

为了在容器重启后仍能保留数据,可以创建本地主机上的目录用于持久化存储元数据和服务数据:

mkdir -p /path/to/databend/meta-data
mkdir -p /path/to/databend/query-data
3. 运行 Databend Meta 服务
docker run -d --name databend-meta \
  -v /path/to/databend/meta-data:/var/lib/databend-meta \
  -e "DATABEND_QUERY_HTTP_PORT=8001" \
  databend-docker:databend-meta

这里,-v 参数将主机上的目录映射到容器内的 /var/lib/databend-meta 目录。

4. 运行 Databend Query 引擎
docker run -d --name databend-query \
  --link databend-meta:databend-meta \
  -v /path/to/databend/query-data:/var/lib/databend-query \
  -p 8080:8080 \
  databend-docker:databend-query

这里的 --link 参数用于连接查询引擎与元数据服务容器,使查询引擎能够访问元数据服务。同时 -p 参数用于映射查询引擎的 HTTP 端口到宿主机上。

5. 配置环境变量(可选)

根据需要,可以设置其他环境变量来配置数据库的行为,例如日志级别、监听地址等。请查阅 Databend 文档了解可用的环境变量列表。

6. 访问和测试 Databend

启动容器后,可以通过如下方式访问 Databend 查询引擎:

  • HTTP API: 在浏览器或 Postman 中访问 http://localhost:8080/ (如果映射的是本机端口)。
  • SQL Client:通过 MySQL 客户端工具如 MySQL Workbench 或者命令行工具连接至 Databend,端口通常为 3307,用户名和密码可能需要查看具体文档或环境变量配置。

请始终参照最新的官方文档进行操作,因为具体的参数和配置可能会随时间发生变化。以上示例是基于假设的默认配置给出的。

Centos 9下安装和使用

在CentOS 9系统上安装Databend的大致步骤(以最新的官方文档为准):

1. 确保环境准备就绪
  • CentOS 9系统已经安装了必要的开发工具和依赖库。
  • Rust编程语言环境已安装。
# 更新系统并安装必要软件包
sudo dnf update -y
sudo dnf install -y curl git make gcc-c++ zlib-devel openssl-devel

# 安装Rust
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
source $HOME/.cargo/env
2. 安装Databend
  • 使用Rust的Cargo来构建和安装Databend的服务器部分(metasrv和databend-query)。
# 克隆Databend源代码
git clone https://github.com/datafuselabs/databend.git
cd databend

# 构建并安装
cargo build --release --bin metasrv
cargo build --release --bin databend-query

# 创建用于存放运行时数据的目录
mkdir -p /var/lib/databend/meta /var/lib/databend/data
3. 配置与启动服务
  • 配置Databend的元数据存储、日志路径等参数,并启动服务。
# 编写配置文件(这里仅提供示例配置)
cat << EOF > /etc/databend/config.toml
[meta_service]
listen = "127.0.0.1:9191"
data_dir = "/var/lib/databend/meta"

[databend_query]
http_server_address = "0.0.0.0:8000"
query_pool_size = 4
local_data_path = "/var/lib/databend/data"
EOF

# 启动metasrv服务
./target/release/metasrv --config /etc/databend/config.toml &

# 启动databend-query服务
./target/release/databend-query --config /etc/databend/config.toml &
4. 验证安装
  • 在本地或通过网络连接到Databend Query API端口进行验证。
# 如果是在本地机器上安装,可以尝试执行一个简单的查询
curl -G "http://localhost:8000/v1/query" --data-urlencode 'sql=SELECT version()' 

# 应该返回类似如下信息:
{"results":[{"meta":{"columns":[{"name":"version","type":5}],"rows":[["nightly"]]},"stats":{"elapsed_time":...}}]}
注意事项:
  • 实际部署中,您可能需要为Databend设置持久化存储,比如挂载适当的磁盘分区或使用云存储服务。
  • 生产环境中,请确保使用稳定的版本而非nightly版,并根据官方推荐的最佳实践进行配置和管理。
  • Databend还支持通过Docker容器方式部署,对于生产部署而言,采用Docker Compose或者Kubernetes等方式更加便捷且易于维护。

请始终查阅最新版的Databend官方文档获取详细的安装指导:https://docs.databend.rs/

Databend、lakeFS 和 MinIO三者结合

高性能、可扩展、分布式对象存储系统MinIO的介绍、部署步骤以及代码示例-CSDN博客

Databend、lakeFS 和 MinIO 的功能介绍:

  1. Databend

    • Databend 是一个开源的实时分析型数据仓库,它构建在 Rust 之上,并兼容 Apache Arrow 格式。
    • 提供了类似 Snowflake 的云原生架构,支持高并发查询和近实时的数据插入与更新。
    • 支持 SQL 查询语言,可以处理 PB 级别的数据并提供亚秒级延迟的交互式分析体验。
    • 集成了多种数据源,并且可以通过 JDBC/ODBC 连接各种 BI 工具进行数据分析。
  2. lakeFS

    • lakeFS 是一种基于 Git-like 分支模型的对象存储管理工具,适用于 AWS S3 或其他 S3 兼容存储服务(如 MinIO)。
    • 它为数据湖提供了版本控制功能,允许用户对存储在对象存储中的数据集创建分支、合并、回滚等操作。
    • 用户可以在不同的分支上进行数据开发、测试和生产流程,增强了数据资产管理能力,简化了数据流水线的治理和审计工作。
  3. MinIO

    • MinIO 是一款高性能、分布式的对象存储系统,完全兼容 Amazon S3 API。
    • 可以部署在本地或云端,用于大规模非结构化数据存储,包括大数据分析所需的原始数据、备份和归档数据等。
    • 提供高可用性、可扩展性和安全性,适合用作企业内部或者混合云环境下的对象存储解决方案。

三者结合使用的方式及示例:

假设您希望将 MinIO 作为底层存储,通过 lakeFS 对其上的数据进行版本管理和分支操作,并使用 Databend 对这些数据进行查询分析。以下是大致的配置步骤和使用方法:

配置步骤:
  1. 部署 MinIO

    • 在服务器集群或单台机器上安装并启动 MinIO,确保其网络可达并已配置好适当的访问密钥和私有密钥。
  2. 配置 lakeFS

    lakectl init my-repo s3://

  3. 上传数据到 lakeFS

    lakectl cp local-data.csv lakefs://my-repo/main/data.csv
    lakectl branch create my-repo/dev --parent main
    lakectl cp local-data-dev.csv lakefs://my-repo/dev/data.csv

  4. 配置 Databend 数据源

    • 在 Databend 中设置一个 S3 数据源,指向 lakeFS 的其中一个分支(例如 main 分支),这样 Databend 就能读取该分支下的数据进行分析。

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Linux运维工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Linux运维全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Linux运维知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加VX:vip1024b (备注Linux运维获取)
img

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
img

09、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
[外链图片转存中…(img-GLeF1fpJ-1712903929760)]

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值