GENRE

1、整体设计

该工作(GENRE)在新闻推荐的场景下,用 LLM 构造了三个不同的prompts,分别来进行新闻摘要的改写,用户画像的构建,还有样本增强。

2、分模块介绍

摘要改写:把新闻的title, abstract 还有category 当作输入,然后要求大语言模型来生成一个摘要,把这个摘要当作这个新闻的 new feature输入下游。

用户画像:根据用户过去观看过的新闻的标题,尝试去问大语言模型是否知道这个用户的一些感兴趣的topic,也就是用户的喜好和他所在的位置。

样本扩充:有一些用户看过的新闻非常少,所以用大语言模型来做一些样本的扩充。这里是把用户看过的一些新闻的category,还有 title 输入到大语言模型里面去,希望大语言模型能够根据他看过的这些新闻,生成出来一些用户并没有看过,但可能感兴趣的“伪新闻”,然后把这些“伪”交互数据也当作训练集的一部分来进行训练。

实验表明这些手段都可以增强原始推荐的效果。

3、参考文献

A First Look at LLM-Powered Generative News Recommendation

https://arxiv.org/pdf/2305.06566

华为 当LLM的优势与推荐系统结合后~

A First Look at LLM-Power
ed Generative News Recommendation | Semantic Scholar

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GTZAN Genre Collection数据集是一个音乐分类数据集,其中包含了10种不同风格的音乐,每种风格有100首歌曲。这个数据集广泛用于音乐信息检索和音乐分类的研究。 要下载GTZAN Genre Collection数据集,可以按照以下步骤进行: 1. 打开一个网络浏览器,例如Google Chrome或Mozilla Firefox。 2. 在搜索栏中输入“GTZAN Genre Collection数据集下载”,然后按下回车键进行搜索。 3. 在搜索结果中找到可信的网站或研究论文的链接,这些链接通常能够提供数据集的下载或进一步的信息。 4. 点击适当的链接,进入相关的网站或页面。 5. 在网站或页面上浏览,找到数据集的下载选项。这可能是一个直接的下载链接,或者是一个需要填写信息或注册账号后才能获取数据集的选项。根据具体情况,点击相应的按钮或链接进一步操作。 6. 如果需要填写信息或注册账号,按照网站的指示进行操作。确保提供的信息是准确和真实的,并遵循该网站的用户规定。 7. 一旦下载选项可用,点击下载链接,数据集将开始下载。这可能需要一些时间,具体取决于你的互联网连接速度和数据集的大小。 8. 下载完毕后,你可以将数据集保存到你的计算机的指定位置。 9. 接下来,你可以使用相应的数据处理和分析工具来处理和分析GTZAN Genre Collection数据集。 请注意,确保从可信的来源下载数据集,以避免任何潜在的计算机安全或法律问题。另外,合理使用数据集,并遵循合适的许可证和使用规定。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值