实战29：基于VGG与LSTM实现图像对应的描述文本数据+代码可作为毕设

计算机毕设论文

已于 2023-01-08 13:21:21 修改

阅读量539

点赞数 1

分类专栏：机器学习实战100例文章标签： python tensorflow 深度学习自然语言处理人工智能

于 2022-11-25 11:50:32 首次发布

本文链接：https://blog.csdn.net/weixin_55771290/article/details/128035512

版权

114 篇文章 379 订阅 ¥29.90 ¥99.00

订阅专栏

任务描述：本教程将帮助你利用深度学习的方法为照片等图像自动生成文字描述，图像描述是结合计算机视觉与自然语言处理的综合任务，输入一幅图像，输出一段描述该图像的文字，这一任务要求模型可以识别图片中的物体、理解物体间的关系，并用一句自然语言表达出来。
运行环境:在Python3.6环境下测试了本教程代码。需要的第三方模块和版本包括：
```
matplotlib=3.2.2
tqdm=4.47.0
numpy=1.16.0
tensorflow=1.14.0
keras=2.2.5
nltk==3.5
pillow==7.2.0
```
可以使用pip命令安装上述模块并指定版本，pip install tensorflow==1.14.0 keras==2.2.5 tqdm==4.47.0 numpy==1.16.0 matplotlib==3.2.2 nltk==3.5 pillow==7.2.0
方法概述：本教程实现流程如下：

本教程旨在介绍如何利用深度学习工具keras实现一个图像描述模型，通过加载数据、预处理数据、构建模型、训练模型、测试用例依次实现一个图像描述工具，在训练过程中通过可视化监督训练过程。说明：目前本文档仅作为示例，为了加快训练速度模型较为简单，