使用 JavaScript 上传 PDF 并进行 OCR（光学字符识别）

幻想多巴胺

于 2024-08-11 11:12:48 发布

阅读量365

点赞数 3

分类专栏：前端 javascript 技术文章标签：状态模式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hongfu951/article/details/141102937

版权

技术栈

前端：HTML、CSS、Bootstrap
后端：Node.js、Express.js、Multer、Tesseract.js、pdf-lib
OCR 库：Tesseract.js
PDF 库：pdf-lib

设置说明

1. 安装依赖项

后端

进入后端目录并安装所需的包：

bash复制代码cd backend
npm install

前端

可以使用相同的目录来提供静态文件，或者设置一个单独的前端目录。对于提供的 HTML，不需要额外的依赖项。

2. 配置后端

确保安装了以下包：

npm install express cors multer pdf-lib tesseract.js pdf-poppler

3. 启动后端服务器

运行服务器：

node server.js

4. 访问应用程序

打开浏览器并导航至 http://localhost:3000，你将看到可以上传 PDF 文件的前端界面。

工作原理

前端：

用户使用文件输入选择一个 PDF 文件。
在表单提交时，文件通过 POST 请求发送到后端。
在处理 PDF 时，会显示加载旋转图标。

后端：

接收 PDF 文件，如果需要，将其转换为图像，并使用 Tesseract.js 进行 OCR。
从 PDF 图像中提取文本，并将结果返回给前端。

前端代码

以下是前端使用的 index.html 文件：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>PDF Upload and OCR</title>
    <link href="https://stackpath.bootstrapcdn.com/bootst

最低0.47元/天解锁文章

幻想多巴胺

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

幻想多巴胺 CSDN认证博客专家 CSDN认证企业博客

码龄17年

253: 原创

7674: 周排名

5106: 总排名

34万+: 访问

: 等级

7424: 积分

1283: 粉丝

1550: 获赞

10: 评论

1519: 收藏

私信

关注

热门文章

分类专栏

软件推荐 6篇
人工智能 26篇
后端 11篇
前端 55篇
linux 4篇
产品 1篇
微服务 1篇
系统安全 2篇
量子计算 1篇
javascript 4篇
JAVA 1篇
test 1篇
自动化测试 1篇
excel 1篇
AE插件 2篇
AE模板 1篇
数据标注 1篇
工业设计 1篇
数据库 1篇
openai 1篇
资源 5篇
Hwebui 8篇
其他 2篇
其他 1篇
技术 104篇
收藏
游戏
音乐
论文 174篇
设计 63篇

最新评论

2024 年最佳开源 Flutter 图标库
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619260276。
用aspose word读取word内容到数据库中
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
软件推荐-Dashcam Viewer Plus查看行车记录仪
幻想多巴胺: 你看是否有显示速度指示仪表盘，如果没显示的话，可能是设置选项没打开，还有检查如下其他项：行车记录仪并未记录速度信息：有些行车记录仪可能并不会将速度等数据直接嵌入视频中。即使 Dashcam Viewer 支持某些行车记录仪的元数据读取，也有可能这些信息在视频中并不存在。软件版本限制：某些版本的 Dashcam Viewer 可能对元数据的读取支持并不完整。你可以尝试更新软件到最新版本，看看是否有改进。文件格式不支持：可能行车记录仪的视频文件格式或者编码方式不被 Dashcam Viewer 完全支持，导致无法正确解析其中的速度信息。要解决这个问题，你可以尝试以下方法：更新软件版本：查看是否有最新版本的 Dashcam Viewer，可能新版本修复了之前版本存在的问题。检查行车记录仪设置：在行车记录仪的设置中查看是否有关于记录速度信息的选项。可能需要在记录视频时打开这个选项。转换视频格式：有些视频编辑软件可以处理视频元数据，你可以尝试将视频转换成支持的格式，然后再用 Dashcam Viewer 查看。
软件推荐-Dashcam Viewer Plus查看行车记录仪
初出茅庐交通: 你好，很冒昧打扰到您，有一个问题想咨询一下您，我安装了Dashcam Viewer Plus3.9.4，但是他不能显示识别出行车记录仪视屏的速度，您能指导一下是什么原因吗？盼复，谢谢
资源下载或者安装说明
大家一起学编程（python）: 999,六翻了

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

幻想多巴胺 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。