Unstract 简介
Unstract[1] 一个无代码平台,它利用大型语言模型(LLM)来自动化机器间的交互,通过简单的无代码方法,可以启动API和ETL(Extract, Transform, Load)管道,将非结构化文档转化为结构化的JSON数据。
它不仅支持API的部署,还能从多种云文件或对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。
项目特点
主要特点
-
无代码操作:用户无需编写代码即可创建和部署API及ETL管道。
-
机器间自动化:超越传统的机器辅助人类自动化,实现机器间的自动化处理。
-
支持多种云存储和数据库:与多种云文件存储系统和数据库兼容,包括AWS S3、Minio、Dropbox等。
-
大型语言模型支持:支持多种LLM提供商,如OpenAI、Google Vertex AI等。
-
ETL管道:能够处理非结构化数据,将其转换为结构化数据并存储到数据仓库。
使用场景
-
自动化业务流程:涉及复杂文档处理的关键业务流程自动化。
-
数据整合:将分散在不同云存储中的非结构化数据整合并转化为结构化数据。
-
API部署:快速部署处理非结构化文档的API。
项目使用
-
系统要求:至少需要8GB RAM。
-
先决条件:需要Linux或MacOS操作系统,以及Docker和Git。
-
安装步骤:
-
下载或克隆Unstract仓库。
-
运行
./run-platform.sh
脚本来启动平台。 -
访问
http://frontend.unstract.localhost
并使用用户名和密码unstract
登录。
-
-
快速开始:通过Quick Start Guide[2]了解Unstract的基础知识,并学习如何连接不同的系统。
参考文档
-
Unstract官方文档[3]
-
Unstract官方网站[4]。
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
欢迎关注&点赞&在看,感谢你的阅读~
资源列表
[1]
Github地址: https://github.com/Zipstack/unstract
[2]
Quick Start Guide: https://docs.unstract.com/unstract_platform/quick_start
[3]
Unstract官方文档: https://docs.unstract.com/
[4]
Unstract官方网站: https://unstract.com