PP-OCRv4识别模型路径解析与应用

最新推荐文章于 2025-05-11 08:58:39 发布

Leon_Jinhai_Sun

最新推荐文章于 2025-05-11 08:58:39 发布

阅读量133

点赞数 6

文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/Leon_Jinhai_Sun/article/details/147764653

版权

解释 `rec_model_dir` 参数

rec_model_dir 是 PaddleOCR 中用于指定文本识别(recognition)模型目录的参数。它指向存储预训练文本识别模型的文件路径。

具体解释

在您提供的配置中：

rec_model_dir="C:\\Users\\Lsun/.paddleocr/whl\\rec\\ch\\ch_PP-OCRv4_rec_infer"

这表示：

使用的是 PP-OCRv4 版本的中文(ch)文本识别模型
模型存储在用户的 .paddleocr 目录下的 whl\rec\ch 子目录中
模型名为 ch_PP-OCRv4_rec_infer，这是 PaddleOCR 官方提供的预训练模型

模型作用

这个文本识别模型负责将检测到的文本区域图像转换为实际的文本内容。它是 OCR(光学字符识别)流程中的第二步，在文本检测之后执行。

示例说明

假设我们有如下使用场景：

基本使用示例：

from paddleocr import PaddleOCR

# 初始化OCR，会自动下载模型到指定目录(如果不存在)
ocr = PaddleOCR(rec_model_dir="C:\\Users\\Lsun/.paddleocr/whl\\rec\\ch\\ch_PP-OCRv4_rec_infer",
                use_angle_cls=True, lang="ch")

# 进行OCR识别
result = ocr.ocr("example.jpg", cls=True)

自定义模型路径示例：
如果您有自己的训练模型，可以指定其他路径：

ocr = PaddleOCR(rec_model_dir="D:\\my_models\\my_custom_rec_model",
                rec_char_dict_path="D:\\my_models\\my_dict.txt")

不同语言模型示例：
如果要使用英文识别模型：

ocr = PaddleOCR(rec_model_dir="C:\\Users\\Lsun/.paddleocr/whl\\rec\\en\\en_PP-OCRv4_rec_infer",
                lang="en")

模型目录内容

ch_PP-OCRv4_rec_infer 目录通常包含以下文件：

inference.pdiparams: 模型参数文件
inference.pdmodel: 模型结构文件
inference.pdiparams.info: 模型参数信息文件(可选)

注意事项

当首次使用 PaddleOCR 时，如果没有指定模型路径，系统会自动下载预训练模型到默认目录(类似于您示例中的路径)
路径中的混合斜杠(\和/)在Windows系统中通常都能正常工作，但最好保持一致性
PP-OCRv4 是 PaddleOCR 的最新版本，相比之前版本有更高的识别准确率
如果您需要处理特殊场景(如手写体、特殊字体等)，可能需要使用自定义训练的模型替换这个默认模型