sigir + recsys + cikm + acl + AAAI 2024论文笔记

zclfe

已于 2024-09-14 18:05:58 修改

阅读量399

点赞数 1

文章标签：论文阅读

于 2024-07-19 17:58:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43845649/article/details/140547324

版权

SIGIR

Scaling Laws For Dense Retrieval

探索信息检索的scaling laws
在这里插入图片描述

Large Language Models for Intent-Driven Session Recommendations

在这里插入图片描述
Motivation: 1. all sessions possess a consistent and fixed number of intentions. 2. they are limited to learning latent intentions solely within the embedding space, greatly impeding the transparency of ISR.

在这里插入图片描述

prompt initialize，初步生成一个ranked list
prompt optimization 修正错误case，并推测原因
prompt selection 选择最好的ranked list

LLaRA: Large Language-Recommendation Assistant

Generative Retrieval as Multi-Vector Dense Retrieval

Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors

在这里插入图片描述
为了减轻llm上线的压力，将LLM层级拆分，low layer冻结负责初步理解每个item具体的信息，聚合为原子表征，压缩长度。
high layer处理每种类型的序列原子表征，以及candidate item，最后全部拼在一起过ctr head。
该模型每天在50M ctr数据上更新。user representation以及item representation可以离线计算。
在这里插入图片描述

在这里插入图片描述

Data-efficient Fine-tuning for LLM-based Recommendation

选择最有效的数据来训LLM。已有工作依赖启发式方式，或者需要在大规模数据上优化。

想要实现两个目标（1）高准确（2）低代价
小模型计算influence score 来计算数据影响精度；effort score寻找对于LLM的难样本。
在这里插入图片描述

Towards a Search Engine for Machines: Unified Ranking for Multiple Retrieval-Augmented Large Language Models

GraphGPT: Graph Instruction Tuning for Large Language Models

graph grounding to link textual and graph structures
在这里插入图片描述
图表征与llm对齐

LLMGR: Large Language Model-based Generative Retrieval in Alipay Search

在这里插入图片描述
不采用多阶段召回，利用LLM中的知识直接产生推荐结果

CoSearchAgent: A Lightweight Collaborative Search Agent with Large Language Models

在这里插入图片描述

Sequential Recommendation with Latent Relations based on Large Language Model

以往考虑物品关系的推荐模型使用kg中的关系，存在稀疏以及需要人工定义的问题。
提出利用LLM来提供新的物品间关系。
在这里插入图片描述
知识图谱

Self-Improving Teacher Cultivates Beer Student: Distillation Calibration for Multimodal Large Language Models

多模态知识蒸馏

Dynamic In-Context Learning from Nearest Neighbors for Bundle Generation

LLaRA: Large Language-Recommendation Assistant

在这里插入图片描述

Unsupervised Large Language Model Alignment for Information Retrieval via Contrastive Feedback

Dimension Importance Estimation for Dense Information Retrieval

Graded Relevance Scoring of Written Essays with Dense Retrieval

I3: Intent-Introspective Retrieval Conditioned on Instructions

Drop your Decoder: Pre-training with Bag-of-Word Prediction for Dense Passage Retrieval.

Generative Retrieval via Term Set Generation

EASE-DR: Enhanced Sentence Embeddings for Dense Retrieval

Fine-Tuning LLaMA for Multi-Stage Text Retrieval

Large Language Models and Future of Information Retrieval: Opportunities and Challenges

C-Pack: Packed Resources For General Chinese Embeddings

提供各类资源用于训练中文embedding
在这里插入图片描述
训练3阶段，pretrain、通用数据微调、task specific微调

Recsys

Scaling Law of Large Sequential Recommendation Models

在纯id-based序列推荐任务上探索scaling law。
在这里插入图片描述

CIKM

Large Language Models Enhanced Collaborative Filtering

先微调大模型让
在这里插入图片描述
ACL

Grounding Language Model with Chunking-Free In-Context Retrieval

Llama2Vec: Unsupervised Adaptation of Large Language Models for Dense Retrieval

在这里插入图片描述

Spiral of Silence: How is Large Language Model Killing Information Retrieval?—A Case Study on Open Domain Question Answering

Synergistic Interplay between Search and Large Language Models for Information Retrieval

Search-Adaptor: Embedding Customization for Information Retrieval

Dwell in the Beginning: How Language Models Embed Long Documents for Dense Retrieval

Distillation Enhanced Generative Retrieval

Token-wise Influential Training Data Retrieval for Large Language Models

Generalizing Conversational Dense Retrieval via LLM-Cognition Data Augmentation

ADAM: Dense Retrieval Distillation with Adaptive Dark Examples

VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval

History-Aware Conversational Dense Retrieval

Landmark Embedding: A Chunking-Free Embedding Method For Retrieval Augmented Long-Context Large Language Models

A Multi-Task Embedder For Retrieval Augmented LLMs

DAPR: A Benchmark on Document-Aware Passage Retrieval

DADA: Distribution-Aware Domain Adaptation of PLMs for Information Retrieval

Retrieval-Augmented Retrieval: Large Language Models are Strong Zero-Shot Retriever

ContextBLIP: Doubly Contextual Alignment for Contrastive Image Retrieval from Linguistically Complex Descriptions

D2LLM: Decomposed and Distilled Large Language Models for Semantic Search

单塔蒸馏双塔,在llm上增加模块，而不训练llm，为了保证精度以及效率
在这里插入图片描述

RocketQAv2: A Joint Training Method for Dense Passage Retrieval and Passage Re-ranking

在这里插入图片描述

In-Batch Negatives for Knowledge Distillation with Tightly-Coupled Teachers for Dense Retrieval

在这里插入图片描述

AAAI

Fine-Grained Distillation for Long Document Retrieval

TwinBERT: Distilling Knowledge to Twin-Structured BERT Models for E€icient Retrieval

Improving Query Representations for Dense Retrieval with Pseudo Relevance Feedback

Dense Text Retrieval based on Pretrained Language Models: A Survey

Optimizing Dense Retrieval Model Training with Hard Negatives

用理论证明hard negatives的优势，能够更好地让模型学会高位的排序

Less is More: Pre-train a Strong Text Encoder for Dense Retrieval Using a Weak Decoder

有关模型大小的理论证明，证明decoder需要小

Dataset Regeneration for Sequential Recommendation

聚焦于将数据集重建，使得相同模型学习之后的效果更好

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

zclfe CSDN认证博客专家 CSDN认证企业博客

码龄6年

23: 原创

113万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

361: 积分

43: 粉丝

59: 获赞

7: 评论

75: 收藏

私信

关注

热门文章

最新评论

sigir + recsys + cikm + acl + AAAI 2024论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
in-context learning and multi-view learning for recommendation
CSDN-Ada助手: 恭喜您在博客领域的持续努力和创作！这篇关于“in-context learning and multi-view learning for recommendation”的博文内容十分深入，展示了您对推荐系统领域的研究和理解。建议您在未来的创作中，可以尝试结合实际案例或者应用场景，进一步探讨这两种学习方法在推荐系统中的具体应用和效果。期待您的下一篇精彩文章！
qwen-vl源码阅读
CSDN-Ada助手: 恭喜您发布了第16篇博客“qwen-vl源码阅读”，不断分享自己的学习心得，让读者也能从中受益。希望您能继续坚持创作，不断提高自身的写作水平，也可以考虑深入分析一些具有挑战性的技术问题，让读者更加深入了解相关知识。期待您的下一篇作品！
Vector Quantization
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“Vector Quantization”听起来非常有趣。您对这个主题的深入探讨无疑会给读者带来新的见解。在未来的创作中，或许您可以考虑探究一下不同的向量量化方法，或者对比一下不同的量化算法的性能。这样的话，读者们将有机会更好地理解向量量化的应用和优势。再次恭喜您，期待您的下一篇博客！
LLM agent
CSDN-Ada助手: 恭喜您写了第14篇博客！标题中的“LLM agent”听起来很吸引人。您在持续创作上做得非常出色，不断分享有趣且有见地的内容。我想给您一个建议，或许您可以在下一篇博客中介绍一下LLM agent的工作原理，或者分享一些您在使用LLM agent时的经验和故事。谦虚地说，我相信这将进一步丰富您的博客内容，吸引更多读者的关注和参与。期待您继续创作，再接再厉！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。