VQA聊天机器人课程笔记

最新推荐文章于 2024-05-21 22:11:21 发布

weixin_45599022

最新推荐文章于 2024-05-21 22:11:21 发布

阅读量276

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45599022/article/details/109063678

版权

VQA用来替代图灵测试测试人工智能的程度：

给定一些图片，及关于图片的一些问题，智能系统给出答案判断系统的智能程度。

VQA模型的思路：

第一步，生成答案（做成文本的分类问题。）

将句子里常见的前20%的答案作为所有答案，通过softmax进行问题判断，差不多可以得到80%左右的问题的正确答案。也就说准确率能达到80%。

第二步，处理数据源（图片）（文字）等

第三步，将图片向量与文字向量拼接起来，然后输入一个分类器模型（svm，CNN等都行）与对应的答案进行训练得到模型

预处理：

训练过程中每10次保存一下训练的权重系数。

json是保存的模型的构架。

数据处理，将问题，图片，答案转换成批量的矩阵形式。

训练完成后保存模型。

对于问题模型的训练这里用了两种方法：一是MLP，即全连接人工神经网络，第二种是LSTM。

用LSTM模型训练问题的向量拼接好的图片的向量组成一维向量做X,与对应的问题标签Y(ONEHOT)编码。

加上LSTM模型

生成最后的模型，然后进行保存。

模型输入输出数据：

加载训练的模型

python导入caffe文件，读入模型

weixin_45599022

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
VQA聊天机器人课程笔记

VQA用来替代图灵测试测试人工智能的程度：给定一些图片，及关于图片的一些问题，智能系统给出答案判断系统的智能程度。VQA模型的思路：第一步，生成答案（做成文本的分类问题。）将句子里常见的前20%的答案作为所有答案，通过softmax进行问题判断，差不多可以得到80%左右的问题的正确答案。也就说准确率能达到80%。第二步，处理数据源（图片）...
复制链接

扫一扫

weixin_45599022 CSDN认证博客专家 CSDN认证企业博客

码龄5年

64: 原创

41万+: 周排名

67万+: 总排名

3万+: 访问

: 等级

700: 积分

11: 粉丝

10: 获赞

3: 评论

73: 收藏

私信

关注

热门文章

最新评论

word2vec实战部分-情感分析方法和TextCNN及FastText进行股票预测
Aretha_seraph: 楼主您好，源码有吗
FastText文本分类代码
李霁明: 请问：“Warning : `load_model` does not return WordVectorModel or SupervisedModel any more, but a `FastText` object which is very similar. ”这个啥意思
Bert训练过程
ctotalk: 不错

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。