DocArray 是一个专门为多模态数据的表示、传输、存储和检索而设计的 Python 库。其设计专为多模式人工智能应用程序的开发而量身定制,可保证与广泛的 Python 和机器学习生态系统的无缝集成。在 2022 年 1 月,DocArray 在 Apache License 2.0 下公开分发,并在 LF AI & Data Foundation 成为了一项沙箱项目。
GitHub 链接:https://github.com/docarray/docarray
文档链接:https://docs.docarray.org/
🆕 新功能
支持 Pydantic v2 🚀 (#1652)
最重要的功能发布是 全面支持 Pydantic V2,因为 Pydantic V2 的核心部分采用 Rust 编写,这给 DocArray 带来了显著的性能提升:
1. JSON 序列化速度提高了 240%。
2. 对于 BaseDoc 和 DocList 的非本地类型(如 TorchTensor)验证速度提高了 20%。
同时,我们仍会持续支持 Pydantic V1。如果您已升级到 Pydantic V2,可能需要对您