基于tf2.0的python中文手写识别项目ocrcn_tf2为什么调不通,我们带您破案

最新推荐文章于 2022-09-30 16:53:43 发布

nju911

最新推荐文章于 2022-09-30 16:53:43 发布

阅读量1.5k

点赞数 6

分类专栏：预报开发杂谈文章标签： python nlp ocr

本文链接：https://blog.csdn.net/nju911/article/details/106892983

版权

为了把手写文本（如历史值班手册等）转化为电子文本，最近尝试在github上查找相关开源项目。功夫不负有心人，找到了基于TensorFlow2.0的中文手写字识别模型，其采用CASIA-HWDB数据集，设计了神经网络达到了相当不错的识别率。
项目地址如下：
https://github.com/jjcheer/ocrcn_tf2
按照操作流程，下载数据，转换格式，生成训练样本。
结果报错如下：
tensorflow.python.framework.errors_impl.InvalidArgumentError: { {function_node __inference_Dataset_map_parse_example_25}} Input to reshape is a tensor with 4446 values, but the requested shape has 4096
看起来是进入模型的数据格式有问题啊，看了下./train_simple.py里面如下代码报错：

def train():
    all_characters = load_characters()
    num_classes = len(all_characters)
    logging.info('all characters: {}'.format(num_classes))
    train_dataset = load_ds()
    train_dataset = train_dataset.shuffle(100).map(preprocess).batch(32).repeat()

应该是整个load_ds的问题。
观察./dataset/casia_hwdb.py中的parse_example函数存在原版和V2版本，而在load_ds上调用的是parse_example，而load_val_ds中调用的则是parse_example_v2。

def parse_example(record):
    features = tf.io.parse_single_example(record,
                                          features={

最低0.47元/天解锁文章

nju911

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
14
评论
基于tf2.0的python中文手写识别项目ocrcn_tf2为什么调不通,我们带您破案

GITHUB上的ocrcn_tf2项目为何报错，本文从多个角度分析错误形成原因，带您破案，并推理错误形成原因。
复制链接

扫一扫

专栏目录

基于tf2.0的python中文手写识别项目ocrcn_tf2为什么调不通,我们带您破案

“相关推荐”对你有帮助么？