录播视频地址:AIS 2022丨ACL-IJCAI-SIGIR顶级会议论文报告会回放视频公开啦
智源官网活动主页,有详细议程的介绍:ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2022)
本文关注5月14日的推荐系统部分。主要内容是截图slides,并附注一些讲解内容。比我之前写cs224w和李宏毅的笔记会简略很多,在图中不言自明的内容我就不另附介绍了。
文章目录
浅谈推荐系统当前热点与趋势
主讲人:武汉大学李晨亮
我估计老师是双屏,一直在转头看提纲哈哈哈哈哈!
本次演讲所涵盖的2022年论文主要包括几大顶会中当时已经出来的会议的论文。
这是在unigram和bigram上的词云分析
(数据是只基于论文标题做的)
工业界关注多任务可能是因为实际场景中会有更多行为,所以需要建模多任务
主讲人的联系方式:cllee@whu.edu.cn
Session 1:Recommendation(推荐系统)
1. 推荐系统中联合多方曝光度的公平性信息
论文:Joint Multisided Exposure Fairness for Recommendation
主讲人:麦吉尔大学吴昊伦
传统的multi-stakeholders的工作一般就只是对两方分别建模然后加起来
multisided problem:多边问题
GG-F就是motivation中提到的范式
IG-F和GI-F都可以看作本文提出的GG-F的定义,因此GG-F更general
2. 关于归纳式的协同过滤任务
论文:INMO: A Model-Agnostic and Scalable Module for Inductive Collaborative Filtering
主讲人:计算所伍云帆
1. Background and Motivation
2. Inductive Module for Collaborative Filtering
购买过相同模板商品的用户,认为是相似用户
MF矩阵分解
3. Experimental Results
4. Conclusions
3. User-controllable Recommendation Against Filter Bubbles
论文:User-controllable Recommendation Against Filter Bubbles
主讲人:新加坡国立大学王文杰
calibration指的是让当前分布与历史分布尽可能一样,以免bias amplification
因为这个模型要求用户进行交互,所以在数据集上做了一些simulation
问题:这个做法跟事后的reranking有什么区别?
主讲人回答:用与control冲突的历史做调整,可以用reranking实现但是需要考虑一些outdated影响(其实我没听懂这啥意思)实验结果也有所对比,证明了该方法的有效性。
4. 会话推荐价格
论文:Price DOES Matter! Modeling Price and Interest Preferences in Session-based Recommendation
主讲人:大连理工大学张晓堃
最后用二者计算商品被购买的概率
问:什么是超图?
主讲人回答:一般的图中一条边只能连接2个节点,超图中一条边可以连接任意个节点。
5. 三选一MMO模型优化总结
阿里巴巴蚂蚁金服堂剑曾冠奇
跟学术界的不一样,这是工业界已经做好的东西(20年10月做的)
连环动作不好建模
高点击低转化属于骗点击的场景,要打击
这个异构专家网络没有在论文里面写,因为一篇论文只能写一个点。
理念是三个臭皮匠顶个诸葛亮。
这个讲者说当时他们没时间写这个内容了,结果被另一篇论文发了:
不线性相关。
这部分讲了业务上强制排单(这块我没太听懂)
问题:这样和只优化CVR的区别?答:只优化CVR,由于这三个不线性相关……(然后的我没太听懂)
6. 评论数据感知,图对比学习
合肥工业大学帅杰
缓解数据稀疏问题
引入Target review:增强交互建模。是和预测的评分相对应的那条评论。只在训练阶段有,测试阶段没有(应该是因为还没买,所以肯定没有评论)。有些工作在训练阶段通过正则化学习目标评论的表征。
使不同邻居得到的节点表征相似:提高鲁棒性
问题:评论对推荐会有可解释性,做了没?答:没做,是个好方向。
7. Session-based recommendation
武大赖思奇
预测用户的下一个交互对象
传统的session-based方法忽略了其他信息导致了数据稀疏性的问题
SSL:self-supervised learning
换了个随机种子产生新的mirror graph
Ablation study:
一个超参
7. 为跨域推荐学习解耦表示
信工所博士曹江峡
跨域推荐需要有重叠信息,这里是用户重叠的场景
右边两个是两种思路。①迁移学习:用户偏好有些领域共有、有些领域特有(这些迁移会带来噪声,负迁移)。为了迁移领域共有的偏好→提出②的解耦学习范式
变分二部图编码器
不用画出UIU或IUI的元路径,而能直接保持二部图的原始结构
图3是basecase:都被领域特有建模了,导致领域共有没有迁移能力了
8. 序列推荐
武汉大学硕士田雨
预测下一个时间步点击item的概率(有多少兴趣)
认为原始胶囊网络缺少时序信息,用BiLSTM实现时序信息增强
micro-video是来自快手的真实数据集,后面两个是亚马逊的
效果比2个低了一些:那两个用了时间特征
9. 信息选择增强序列推荐
北邮李凯元
序列推荐:用户交互数据稀疏
当前主流做法:引入异构信息(知识图谱等)。问题:也会引入噪音,损失数据信号,负协同问题
左图:整条是全模型的表现,粉色是与GRU4Rec的交集
本文主要目标:如何选择辅助信息?
多智能体的马尔科夫决策过程
reward:和推荐系统的收益相关
i
1
i_1
i1-
i
t
i_t
it→
h
h
h:初始的用户历史表达
→模态的选择(
c
1
→
n
c_{1\rightarrow n}
c1→n是不同模态的信息)
交叉熵
off-policy
mean pooling
Q值计算:DQN Q mix网络→生成整体Q值
证明了减少负迁移现象
vtk分别代表文本图片KG3种模态
10. 一个可以持续提升的推荐框架
华为诺亚蔡国豪
混排
精排:模型更新的范式(批次/在线更新),利用扔掉的模型→设计自己学习
11. 知识感知的推荐系统
华中科技大学邹定
Background
有监督学习的问题:稀疏,嵌入相似
自监督/对比学习
模型介绍
图view的生成和编码(适应性编码),local level(拆知识图谱为2个view)结合做图对比学习,将local level和global level(结构view)结合做图对比学习
实验结果
结论
12. 以用户为中心的对话推荐
中科院计算所李硕凯
研究背景
技术方案
相似度
基于对比学习设计预训练损失函数
实验效果
13. 医生推荐
香港理工大学鹿晓鑫
匿名提问,所以没有患者记录(历史数据)
self-learning task:解决style gap的问题