从本节开始,我将带大家完成一个深度学习项目:用图卷积神经网络(GCN),实现一个「火车票文字信息提取」的项目,由于火车票上每个节点文字不是等长的,所以还需要添加一个前置的 LSTM 来提取句子特征。
课前说明
1、这是一个收费课程,如果是在公开平台上可能只是试看,完整版可以到腾讯课堂,或者网易云课堂上订阅。
2、关于免费和收费课的区别,免费课讲解知识点和小项目(比赛),收费课是可以落地商用的,至少是可以写到简历里的项目。
3、本课程定位是项目课,目的是完成功能,LSTM 和 GCN 的理论基础需要前置自学。
功能演示
1、在模型已经训练好的前提下,将需要识别的图片上传到项目中;
2、依次进行OCR识别,图结构生成,模型预测,信息提取流程。
模型结构图示
参考论文和代码
https://arxiv.org/abs/1609.02907
https://github.com/tkipf/pygcn
三方依赖库
1、PaddleOCR,用于识别火车票文字和位置信息
pip install paddlepaddle pip install paddleocr
2、networkx,用于构建图结构
pip install networkx
3、Pytorch,用于构建神经网络
pip install pytorch
更多内容:请查阅「陈华编程官网」