Apache Arrow Rust 项目教程
arrow-rsOfficial Rust implementation of Apache Arrow项目地址:https://gitcode.com/gh_mirrors/ar/arrow-rs
1. 项目的目录结构及介绍
Apache Arrow Rust 项目的目录结构如下:
arrow-rs/
├── arrow/
│ ├── src/
│ ├── Cargo.toml
│ └── README.md
├── arrow-flight/
│ ├── src/
│ ├── Cargo.toml
│ └── README.md
├── object-store/
│ ├── src/
│ ├── Cargo.toml
│ └── README.md
├── parquet/
│ ├── src/
│ ├── Cargo.toml
│ └── README.md
├── parquet_derive/
│ ├── src/
│ ├── Cargo.toml
│ └── README.md
├── dev/
│ ├── format/
│ └── ...
├── .github/
│ └── ...
├── .gitignore
├── Cargo.toml
└── README.md
主要组件介绍
- arrow: 核心功能,包括内存布局、数组和低级计算。
- arrow-flight: 支持 Arrow-Flight IPC 协议。
- object-store: 支持对象存储交互(AWS、Azure、GCP、本地、内存)。
- parquet: 支持 Parquet 列式文件格式。
- parquet_derive: 用于为任意简单结构派生 RecordWriter/RecordReader。
2. 项目的启动文件介绍
在 arrow-rs
项目中,主要的启动文件位于各个子项目的 src
目录下。例如,arrow
子项目的启动文件是 src/lib.rs
。
arrow 子项目
- src/lib.rs: 这是
arrow
子项目的主入口文件,包含了项目的初始化和主要功能模块的加载。
arrow-flight 子项目
- src/lib.rs: 这是
arrow-flight
子项目的主入口文件,负责初始化和加载 Arrow-Flight IPC 协议相关的功能。
object-store 子项目
- src/lib.rs: 这是
object-store
子项目的主入口文件,负责初始化和加载对象存储交互相关的功能。
parquet 子项目
- src/lib.rs: 这是
parquet
子项目的主入口文件,负责初始化和加载 Parquet 文件格式相关的功能。
parquet_derive 子项目
- src/lib.rs: 这是
parquet_derive
子项目的主入口文件,负责初始化和加载派生 RecordWriter/RecordReader 相关的功能。
3. 项目的配置文件介绍
在 arrow-rs
项目中,主要的配置文件是 Cargo.toml
文件,它位于每个子项目的根目录下。
arrow 子项目
- Cargo.toml: 包含了
arrow
子项目的依赖、版本和其他配置信息。
arrow-flight 子项目
- Cargo.toml: 包含了
arrow-flight
子项目的依赖、版本和其他配置信息。
object-store 子项目
- Cargo.toml: 包含了
object-store
子项目的依赖、版本和其他配置信息。
parquet 子项目
- Cargo.toml: 包含了
parquet
子项目的依赖、版本和其他配置信息。
parquet_derive 子项目
- Cargo.toml: 包含了
parquet_derive
子项目的依赖、版本和其他配置信息。
这些配置文件定义了每个子项目的依赖关系、版本信息和其他必要的配置项,确保项目能够正确编译和运行。
arrow-rsOfficial Rust implementation of Apache Arrow项目地址:https://gitcode.com/gh_mirrors/ar/arrow-rs