图像生成文本show and tell模型1—图像特征抽取1—数据介绍、词表生成

最新推荐文章于 2024-04-29 12:14:45 发布

SSssss630

最新推荐文章于 2024-04-29 12:14:45 发布

阅读量708

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanjiu4221/article/details/100561145

版权

1.数据集：
flicker30k
下载使用链接：
https://blog.csdn.net/gaoyueace/article/details/80564642

2.针对两种数据的存放格式做一个描述放在它的描述文件中：

（1）对于图像处理：

提取图像特征：

在show and tell模型中是用一个CNN去提取，提取出来之后这个图像特征就不变了：

先把所有图像的图像特征都抽取出来，然后在模型训练中直接去用即可：

（2）对于图像描述数据处理：
把所有图像描述的资料都统计出来：

3.首先从统计词表开始：

（1）引入必要的库
（2）定义好输入和输出文件：
输入文件是图片描述文件
输出是vocab文件
在这里插入图片描述
（3）定义一个函数去做词表统计：

找出最长长度及长度的分布：
vocab用于统计词表：
在这里插入图片描述

做词频的统计：

做一个返回：

运行结果：

所以对于flicker30k数据集来说，把长度设置为30-45都比较合理

（4）打印词表和把词表提出到具体文件中：
先对词表进行排序：

在这里插入图片描述
运行结果：

在这里插入图片描述
以上~词表生成词频统计就完成了

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
图像生成文本show and tell模型1—图像特征抽取1—数据介绍、词表生成

1.数据集：flicker30k下载使用链接：https://blog.csdn.net/gaoyueace/article/details/805646422.针对两种数据的存放格式做一个描述放在它的描述文件中：（1）对于图像处理：提取图像特征：在show and tell模型中是用一个CNN去提取，提取出来之后这个图像特征就不变了：先把所有图像的图像特征都抽取出来，然后在模型训...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。