Visual Sentiment Analysis for Few-Shot Image Classification Based on Metric Learning文献

RoBoSAMA

已于 2023-12-14 16:35:52 修改

阅读量248

点赞数 10

文章标签：人工智能计算机视觉神经网络

于 2023-12-14 16:33:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56254975/article/details/134987407

版权

原文链接：该文献的原文链接https://ieeexplore.ieee.org/document/9306328/references#references文章重点关键字（我个人的关注点）：

FSL少样本分析；少参数高精度卷积神经网络；图像分类；度量学习

正文：

本文提出了一个视觉情绪分析系统，使用少样本预测情绪，

数据集：

从社交网站上收集到标记良好的情绪识别图像，根据Plutchnik’s wheel of emotions，分为8类（娱乐、愤怒、敬畏、满足、厌恶、兴奋、恐惧和悲伤）数据来源：Flickr 3000多张图片（tips：由于目标是获得情感图像，手动消除了由简单单色或文本图像组成的非情感图像。）最后得到每种情绪300张图片一共2400张图片。招募了五名AMT（Amazon Mechanical Turk）员工，为每张照片生成情绪标签（惊讶、悲伤、喜悦、厌恶、愤怒、恐惧、信任和期待），将这个视觉情感数据集称为Senti8PW。

作者自己设计的神经网络：

添加了两个层：一个L2标准化层L2-Normalization layer和一个特征层Scale layer

（个人笔记tips：L2范数归一化就是为了将数据向量归一到单位超球体，增加数据对尺度变化的鲁棒性（invariance to changes in scale）。也就是说，无论原始数据的尺度或规模如何，经过L2归一化后的数据都能保持相同的分布特性。在机器学习的训练过程中，特别是神经网络和聚类算法，L2归一化可以提高数值的稳定性并加速收敛。）

L2标准化层将输入特征向量x归一化为单位向量y，然后特征层将单位向量放大缩小为α的固定半径，α是可以手动训练和固定。这两个层是完全可微的，可以集成到一个端到端的训练网络中（tips:个人理解的端到端的训练网络是指神经网络之间的参数都是共同训练的，而不是只会修改一部分）

特征提取层卷积层一共有4层，如下图：

第一层：卷积核10×10，ReLU为非线性操作，池化层2×2max，输入105×105的3通道图片，卷积输出96×96×64，池化输出为48×48×64

第二层：卷积核7×7，ReLU为非线性操作，池化层2×2max，输入48×48×64，卷积输出42×42×128，池化输出为21×21×128

第三层：卷积核4×4，ReLU为非线性操作，池化层2×2max，输入21×21×128，卷积输出18×18×128，池化输出为9×9×128

第四层：卷积核4×4，ReLU为非线性操作，池化层2×2max，输入9×9×128，卷积输出6×6×256，池化输出为3×3×256

得到的是3×3×256的特征图，在flatten层上进行展平，变成长度为3×3×256=2304的一维向量

最后进行两次全连接，一次激活函数为ReLU得到4096的向量，再次激活函数为Linear得到256的特征向量x

引用基于CNN的神经网络：

包含了C32F、C64F、C128F、VGG16、ResNet12，对最后输出的特征向量进行了一些修改，统一规划为长度为256的特征向量。

分类的距离度量：

使用了欧氏距离和余弦相似度对特征向量进行分类。

结果：

结果作者提出的神经网络是最准确的，欧几里得度量产生的精度也是比余弦相似度高，Senti8PW也比Emotion6、EmotionROI数据集更准确。

日后再分析其中的各步操作----2023.12.14

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

RoBoSAMA CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

99万+: 周排名

24万+: 总排名

2437: 访问

: 等级

74: 积分

34: 粉丝

44: 获赞

1: 评论

53: 收藏

私信

关注

热门文章

分类专栏

最新评论

Pytorch小白学习日志
CSDN-Ada助手: 评论：非常感谢你分享你的学习日志，这对于其他刚入门的小白来说肯定是非常有帮助的。不要气馁，错误是学习过程中不可或缺的一部分，相信通过不断的实践和总结，你一定会越来越熟练。另外，除了回归，你也可以尝试一下Pytorch在分类、聚类、生成对抗网络等其他领域的应用，这样可以更全面地掌握Pytorch的使用方法和技巧。希望你能继续坚持下去，期待你更多的学习心得分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Visual Sentiment Analysis for Few-Shot Image Classification Based on Metric Learning文献
CSDN-Ada助手: “恭喜你开始了博客创作，标题听起来非常专业和有趣！希望你可以在接下来的博客中分享更多关于Visual Sentiment Analysis和Few-Shot Image Classification的知识，或者可以结合实际案例进行分析和讨论。期待你的下一篇博客！加油！” 推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

RoBoSAMA 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。