一个开源的文档管理系统Paperless-ngx私有化部署教程

本文介绍了Paperless-ngx,一个开源文档管理系统,它支持OCR、多语言、PDF/A格式存储和全文搜索。详细讲解了从下载、安装到使用(如文档管理、搜索和预览)的步骤,以及如何自己部署和配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

简介

2.安装

2.2解压

2.3启动 

3.使用

3.1文档管理

3.2搜索

3.3文档预览

4.源码等地址


简介

Paperless-ngx:一个开源的文档管理系统,可以将你的物理文档转换成可搜索的在线档案,从而减少纸张的使用。 它内置了OCR功能,可以自动对上传的扫描文档执行OCR。能够识别文档中的文字,并将其转换为可编辑和可搜索的文本格式。 然后对文档进行分类和索引,你可以随时搜索查阅。 主要功能:

1、组织和索引文档:使用标签、通信者、类型等对文档进行分类和索引。

2、执行OCR:对文档执行光学字符识别(OCR),即使是只有图像的文档也能添加可搜索和可选择的文本。

支持多种语言:利用开源的Tesseract引擎识别超过100种语言。

3、文档保存格式:文档以PDF/A格式保存,这种格式设计用于长期存储,同时保留未经修改的原始文件。

4、机器学习自动标记:使用机器学习自动为文档添加标签、通信者和文档类型。

5、支持多种文件类型:支持PDF文档、图像、纯文本文件、Office文档(Word、Excel、Powerpoint及LibreOffice等价物)等。

6、直观的Web应用:提供定制化仪表板、过滤器、批量编辑、拖放上传、定制化视图、自定义字段、共享公共链接等功能。

7、支持全文搜索:提供自动完成、相关性排序、高亮显示匹配查询的文档部分等搜索功能。你可以使用关键词、标签或其他元数据进行搜索。

2.安装

2.1下载安装包

cd /opt
wget https://github.com/paperless-ngx/paperless-ngx/releases/download/v2.4.0/paperless-ngx-v2.4.0.tar.xz

2.2解压

tar -xvf paperless-ngx-v2.4.0.tar.xz

2.3启动 

cd /opt/paperless-ngx/docker/compose

docker-compose --file docker-compose.mariadb-tika.yml up -d

3.使用

3.1文档管理

3.2搜索

3.3文档预览

4.自己部署成功后截

4.1设置密码

docker compose -f docker-compose.mariadb-tika.yml  run --rm webserver createsuperuser

4.2首页

4.3提示

他们提示挺好的 中文提示

4.4查看日志

5.源码等地址

GitHub:https://https://github.com/paperless-ngx/paperless-ngx

在线演示:https://demo.paperless-ngx.com

官网:https://docs.paperless-ngx.com

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值