[文献阅读] 基于在线民宿评论的多媒体情感模型

文章地址

https://www.mecs-press.org/ijem/ijem-v10-n4/IJEM-V10-N4-2.pdf

核心观点

这篇论文主要介绍了一种基于图像文本融合的在线民宿评论情感分析方法。该方法旨在解决传统情感分析仅基于文本的问题(如未考虑特殊符号、表情图像等因素,无法充分提取用户情感),作者采用了图像和文本特征相融合的方法来提高分类效果。

具体包括:

对文本数据,首先使用了Word2vec构建主题聚类模型,然后通过主题中心词找到对应的主题属性字典,再使用贝叶斯分类器进行情感分析,并与SVM和决策树方法进行了性能对比。

对图像数据,针对图片数据集,通过参数迁移初始化卷积神经网络(CNN)模型,然后对CNN模型进行微调训练得到图像情感分类模型;

最后,设计融合方法计算出图像文本的情感概率,并与用户评分进行比较

实验结果显示,该方法在在线民宿评论的情感分析中具有较好的分类效果,准确率达到88.6%,高于文本情感分析模型或图像情感分析模型,更有效地避免了用户评分与评论中表达的情感不一致的问题。

文章大纲

1.引言

    背景介绍:介绍在线民宿评论的背景和重要性

    现象描述:指出用户评分与评论情感不一致的问题

    文章目的:提出基于图像文本融合的情感分析方法,以期提高情感分类准确率

2.材料与方法

    文本情感分析:使用机器学习方法进行文本情感分类

    图像情感分析:建立基于CNN的图像情感分类模型

    模型融合:采用决策层融合方法结合文本和图像情感概率

3.结果与讨论

    数据来源:介绍实验所使用的数据集

    评价指标:确定实验的评价指标

    文本情感分类:详细描述文本情感分类过程和不同分类器的比较结果

    图像情感分类:详细描述图像情感分类过程

    模型性能分析:分析模型融合后的分类效果

4.结论

    结论总结:总结基于图像文本融合的情感分析方法的有效性

    局限与展望:指出了实验的局限性,并展望后续研究方向

阅读笔记

一、使用机器学习方法进行文本情感分类的具体细节:

1. 文本预处理:包括分词、去除停用词、特征提取等步骤。首先使用jieba进行分词,并提取名词作为特征词,然后利用Word2Vec方法将文本转换为词向量表示。

2. 特征提取:通过统计高频名词,构建评论的特征词典。根据特征词的中心词,找到对应的主题属性词典。

3. 情感分析:通过贝叶斯、SVM和决策树三种分类器进行文本情感分类,并选择准确率最高的贝叶斯分类器进行文本情感分析。

4. 模型比较:记录三种分类器在不同特征上的准确率和召回率,并发现贝叶斯分类器整体准确率最高,为82.5%。

5. 情感分布可视化:绘制不同特征的情感分布图,显示不同特征的情感倾向分布情况。

6. 模型性能评估:贝叶斯分类器能充分提取文本评论的特征主题,因此可以较好地识别正面情感评论。

个人idea小记:

贝叶斯分类器在处理否定句时的效果在文章中并未具体提及。然而,根据贝叶斯分类器的原理,它在处理否定句时可能存在一定的局限性。

贝叶斯分类器通常基于先验概率和条件概率来计算后验概率,并选择具有最大后验概率的类别。在处理否定句时,由于否定词的存在,可能导致句子的语义发生逆转,影响特征词的权重计算。如果特征词的权重计算不当,将可能导致贝叶斯分类器对否定句的情感倾向产生误判。

如果想提高贝叶斯分类器对否定句的处理效果,可以考虑:

1.识别否定词,并对其进行特别处理。或学习否定规则,自动处理否定词及其对句子情感倾向的影响。

2.进行语义角色标注,区分主语、谓语、宾语等成分,这样能更准确地理解句子的情感意义。

3.利用上下文信息,结合语义角色标注结果,综合判断句子的情感倾向。

二、使用CNN建立图像情感分类模型的具体细节:

1. 图像预处理:将图像的RGB参数转换为HSV颜色空间,并进行量化处理,从而提取图像的颜色特征。

2. 模型结构:包含3个卷积层、2个池化层、2个全连接层、1个Flatten层、2个Dropout层和1个Softmax层。

3. 卷积层:每个卷积层包含32个3x3的卷积核,激活函数为ReLU。

4. 池化层:采用最大池化,池化大小为2x2。

5. 全连接层:第一个全连接层包含512个神经元。

6. Softmax层:采用Softmax激活函数进行多分类。

7. 参数设置:Batch大小设置为4,迭代次数设置为20。

8. 迁移学习:使用预训练的CNN模型进行初始化,然后通过微调训练获得图像情感分类模型。

10. 实验结果:文本情感分类模型的召回率较高,而图像情感分类模型的召回率较低,这可能是因为图像特征提取不够充分。

三、融合文本和图像情感概率,构建情感判定模型的具体细节:

1.采用决策层融合方法,即根据一定标准,将文本情感概率和图像情感概率进行加权,以计算最终的融合情感概率。

具体的公式为:

P_final = λ * P_text + (1-λ) * P_image,其中P_text是文本情感概率,P_image是图像情感概率,λ是文本情感在最终分析结果中的重要性的权重,通常设为0.5。

2. 情感判断:如果融合情感概率大于0.5,则判定为正面情感,否则为负面情感。

3. 模型验证:通过比较融合情感概率与用户评分的一致性,证明该模型可以有效避免用户评分与评论表达情感不一致的问题。

4. 实验结果:实验结果显示,基于图像文本融合的情感分析模型的分类效果更好,其准确率达到88.6%,高于单独的文本情感分析模型或图像情感分析模型。

  • 17
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值