图像生成文本show and tell模型1—图像特征抽取1—数据介绍、词表生成

1.数据集:
flicker30k
下载使用链接:
https://blog.csdn.net/gaoyueace/article/details/80564642

2.针对两种数据的存放格式做一个描述放在它的描述文件中:

(1)对于图像处理:

提取图像特征:

在show and tell模型中是用一个CNN去提取,提取出来之后这个图像特征就不变了:

先把所有图像的图像特征都抽取出来,然后在模型训练中直接去用即可:

(2)对于图像描述数据处理:
把所有图像描述的资料都统计出来:

3.首先从统计词表开始:

(1)引入必要的库
(2)定义好输入和输出文件:
输入文件是图片描述文件
输出是vocab文件
在这里插入图片描述
(3)定义一个函数去做词表统计:

找出最长长度及长度的分布:
vocab用于统计词表:
在这里插入图片描述
在这里插入图片描述
做词频的统计:
在这里插入图片描述
做一个返回:
在这里插入图片描述
运行结果:
在这里插入图片描述
所以对于flicker30k数据集来说,把长度设置为30-45都比较合理

(4)打印词表和把词表提出到具体文件中:
先对词表进行排序:

在这里插入图片描述
运行结果:

在这里插入图片描述
以上~词表生成 词频统计就完成了

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值