在推荐系统的江湖中,一直有着这样一个传说:谁能开发出一个通用的、强大的推荐模型,谁就能成为这个领域的"姜太公"。而今天,我们要介绍的RecGPT,就有可能是那个手持"钓竿"的姜太公。
🎣 姜太公的钓竿:RecGPT的诞生
推荐系统的发展历程可谓是跌宕起伏。从最初的协同过滤,到后来的深度学习模型,再到如今的大语言模型,每一次技术的进步都让我们离"完美推荐"更近了一步。然而,真正通用且强大的推荐模型却一直是可望而不可即的梦想。
直到RecGPT的出现。
RecGPT是由越南VinAI研究院的Hoang Ngo和Dat Quoc Nguyen团队开发的一个基于大语言模型的推荐系统。它的核心思想是:通过对大量文本数据的预训练,让模型学会理解用户偏好和物品特征,从而实现更精准的推荐。
这个想法听起来似乎很简单,但实现起来却并非易事。团队面临的第一个挑战就是数据:如何收集足够多、足够好的训练数据?
他们的解决方案是:广撒网。他们从Amazon、Anime、BookCrossing、Food、Goodreads、HotelRec、MovieLens、Netflix、Steam、WikiRec和Yelp等多个领域收集了海量数据,最终得到了一个包含1000多万用户、1000多万物品和2.5亿多条交互记录的庞大数据集。
有了数据,下一步就是模型的设计和训练。RecGPT采用了7B参数的Transformer解码器结构,并引入了Triton flash attention和ALiBi等技术来提高性能。模型的预训练过程长