推荐系统重排：MMR 多样性算法

进一步有进一步的欢喜

已于 2025-04-06 20:39:59 修改

阅读量1.4k

点赞数 33

分类专栏：推荐系统文章标签：算法 MMR 多样性算法重排推荐系统

于 2025-01-05 15:11:41 首次发布

本文链接：https://blog.csdn.net/qq_22866291/article/details/144945793

版权

`和谐共存：相关性与多样性在MMR中共舞`

引言

在信息检索和推荐系统中，提供既与用户查询高度相关的文档或项目，同时确保结果的多样性是一个关键挑战。最大边际相关性（Maximum Marginal Relevance, MMR）是一种旨在解决这一问题的算法。本文将深入探讨MMR的工作原理、公式解析、实现细节，并通过具体案例说明其应用价值。
在这里插入图片描述

一、背景

最大边际相关性（Maximum Marginal Relevance, MMR）算法是由Jaime Carbonell 和 Jeffrey Goldstein 在 1998年 提出的。Carbonell 是卡内基梅隆大学计算机科学系的教授，而 Goldstein 当时是他的博士生。

在1990年代末期，随着互联网的迅速发展和数字内容的爆炸式增长，信息检索系统面临着一个新的挑战：如何在提供大量相关结果的同时避免冗余和重复。传统的信息检索方法主要关注于提高结果的相关性，即返回尽可能多的与用户查询匹配的内容。然而，这种方法可能会导致结果中存在大量相似度极高的项目，从而降低了用户体验。

此外，在文本摘要生成领域，研究者们也遇到了类似的问题——自动生成的摘要中可能包含过多重复的信息，无法有效地传达文档的主要观点。为了解决这些问题，Carbonell 和 Goldstein 提出了MMR算法，旨在平衡相关性和多样性，以提升信息检索和自动摘要的质量。

MMR最初被设计用于解决文本摘要中的重复问题，但其理念很快就被推广到更广泛的领域，如搜索引擎优化、社交媒体内容推荐、在线广告投放等。通过MMR算法，不仅可以确保推荐或检索的结果高度相关，还能增加结果的多样性，使得提供的信息更加丰富和个性化，满足用户的多样化需求。

二、算法介绍

1. 相关背景补充 – 相对补集

1.1 定义

在集合论中，相对补集（也称为差集）是指从一个集合 $A$ 中移除所有属于另一个集合 $B$ 的元素后剩下的元素组成的集合。换句话说，它包含那些仅属于集合 $A$ 但不属于集合 $B$ 的元素。如果集合 $A$ 和集合 $B$ 是两个给定的集合，那么 $A$ 相对于 $B$ 的相对补集通常记作 $\setminus B$ 或 $A - B$ 。