多模态推荐系统综述:五、挑战

五、挑战

1、Multimodal Recommender Systems: A Survey 2023

•通用解决方案。 值得注意的是,尽管针对模型中的不同阶段提出了一些方法[24],但没有提供这些技术组合的最新通用解决方案。

•模型可解释性。 多模态模型的复杂性会使系统生成的建议难以理解和解释,从而限制系统的信任和透明度。虽然很少有先驱者提到它,但它仍然需要探索。

•计算复杂性。 MRS需要大量数据和计算资源,因此难以扩展到大型数据集和总体。多模态数据和模型的复杂性会增加生成推荐所需的计算成本和时间,这给实时应用带来了挑战。

•通用MRS数据集。 目前,MRS的数据集仍然有限,涉及的模式不够广泛。此外,不同模式的数据质量和可用性可能会有所不同,这会影响建议的准确性和可靠性。

2、A Comprehensive Survey on Multimodal Recommender Systems: Taxonomy, Evaluation, and Future Directions 2023

2.1 如何有效融合多模态信息?

(1)找出有效的模态融合方法,能够捕获单一模态无法包含的互补信息。 每种模态可能捕获项目的不同方面,我们应该找到一种方法将它们融合在一起,同时保留特定于模态的信息,以学习包含单一模态表示无法包含的补充信息的多模态表示。但对于某些模型,单一模态也能取得比同时利用多模态信息更好的性能。如果模型能够有效地融合多模态特征,推荐精度应该比利用单一模态特征更高。
(2)如何解决模态缺失问题并重构有意义的表示。 模态缺失问题在现实世界中很常见。然而,一些模型假设所有模态信息在训练和推理过程中都是可用的,这在面对不完整和缺失模态时将不起作用。LRMM通过利用生成模型来重建特定于模态的嵌入并估算缺失的模态,从而减轻了模态缺失和冷启动问题。
LRMM: Learning to Recommend with Missing Modalities 2018
在这里插入图片描述

LRMM概述。采用CNN进行可视化嵌入(粉红色部分),采用三个LSTM分别对用户评论文本(红色部分)、项目评论文本(绿色部分)和项目元数据(蓝色部分)进行文本嵌入。生成(自动编码)模型用于重建模态特定嵌入和填充缺失模态。缺少user和item review文本分别导致基于user和item的冷启动。

2.2 如何规范数据分割策略和使用的通用数据集?

找到具有合适提取技术和合适分割策略的最佳预处理方法,以标准化实验的训练/测试集。
(1)正如前面的实验所示,即使使用相同的数据集和评估指标,模型使用不同的数据分割策略也会得到不同的性能数据,模型性能的排名也会受到不同分割策略的影响。
(2)虽然最常用的是随机分割,但基于时间的分割更接近现实场景。鲁棒的多模态推荐模型无论是随机分割还是时间分割都应该表现良好。
(3)用于多模态推荐的数据集并不标准化,而且审稿论文中使用的大多数数据集都不像快手、抖音和大众点评那样公开。
(4)特征提取技术也会影响学习到的最终表示,每篇论文都使用不同的技术。

2.3 评估指标

推荐模型的评价是一个重要的研究课题。 推荐系统不仅要考虑准确性,还要考虑其他推荐质量,如推荐列表的多样性和独特项的存在,这可能会对推荐系统的整体质量产生重大影响。
文献[11]指出,通用推荐的评价指标可能不完全适用于多模态推荐。

2.4 研究与应用差距

(1)在面对大数据集时如何平衡模型的复杂度和可扩展性。
(2)高维张量和多模态信息的计算效率。

2.5 多模态顺序推荐

序贯推荐系统不同于使用协同过滤和基于内容过滤的推荐系统,因为它试图理解和建模用户随时间变化的序贯行为。多模态信息会极大地影响用户的偏好,然而现有的序贯推荐模型大多忽略了这些有用信息。MML结合了项目的多模态边信息,以改进和稳定元学习过程,并帮助解决冷启动问题。因此,在序贯推荐系统中利用多模态信息将是今后工作的一个重要方向。

2.6 跨域推荐

跨域推荐系统利用来自其他域或平台的行为信息来提高目标域的性能。常用的技术依赖于显式重叠数据(例如,公共用户和项目)跨域传输数据。最近,一些工作学习了用户和项目的通用表示,可以应用于跨域推荐。UniSRec利用文本信息学习通用项目表示,而不需要公共用户和项目,这可能适用于不同的领域。在未来,利用多模态信息可能有助于模型学习通用表示。

UniSRec: Towards Universal Sequence Representation Learning for Recommender Systems. 2022
为了开发有效的序列推荐器,提出了一系列序列表示学习(SRL)方法来对历史用户行为进行建模。大多数现有的SRL方法都依赖于显式项目ID来开发序列模型,以更好地捕获用户偏好。尽管这些方法在一定程度上是有效的,但由于显式建模项目ID的局限性,很难推广到新的推荐场景。
为了解决这个问题,我们提出了一种新的通用序列表示学习方法UniSRec。该方法利用项目的相关描述文本学习不同推荐场景下的可转换表示。为了学习通用项目表示,设计了一种基于参数白化和专家混合增强适配器的轻量级项目编码体系结构。为了学习通用序列表示,我们引入了两个对比的预训练任务,通过采样多域否定。利用预先训练好的通用序列表示模型,我们的方法可以在归纳和直推两种情况下以参数有效的方式有效地转移到新的推荐域或推荐平台。
在这里插入图片描述

参考论文

Multimodal Recommender Systems: A Survey

A Comprehensive Survey on Multimodal Recommender Systems: Taxonomy, Evaluation, and Future Directions

  • 24
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
多模态新闻推荐系统是一种利用多种不同类型的数据(如文本、图像、视频等)来进行新闻推荐的系统。它通过综合考虑不同模态数据的特征和关联性,提供更加个性化和丰富的新闻推荐体验。 多模态新闻推荐系统综述可以从以下几个方面进行介绍: 1. 数据来源:多模态新闻推荐系统可以从多个渠道获取数据,包括新闻网站、社交媒体平台、用户行为数据等。这些数据可以包含文本、图像、视频等多种类型。 2. 数据处理:在多模态新闻推荐系统中,需要对不同类型的数据进行处理和特征提取。例如,对于文本数据,可以使用自然语言处理技术进行分词、词向量表示等;对于图像数据,可以使用计算机视觉技术提取特征;对于视频数据,可以使用视频分析技术提取关键帧或者视频摘要等。 3. 模态融合:多模态新闻推荐系统需要将不同类型的数据进行融合,以获取更全面和准确的用户兴趣表示。常见的融合方法包括特征级融合和决策级融合。特征级融合是将不同模态的特征进行拼接或者加权求和;决策级融合是将不同模态的推荐结果进行组合或者排序。 4. 推荐算法:多模态新闻推荐系统可以使用各种推荐算法来生成个性化的推荐结果。常见的算法包括基于内容的推荐、协同过滤推荐、深度学习推荐等。这些算法可以结合用户的历史行为、兴趣模型和多模态数据进行推荐。 5. 用户反馈:多模态新闻推荐系统可以通过用户反馈来不断优化推荐效果。例如,用户可以对推荐结果进行评分、点赞或者收藏,系统可以根据用户反馈进行实时调整和更新推荐策略。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值