一、直播视频回放地址:
2:20 《智能人机互动》 喻纯 <- 打call
24:15 《基于迁移学习的任务型对话系统研究》 车万翔
46:00 《因果推理赋能推荐系统初探》 冯福利
76:30 《知识图谱融合中歧义性与异质性问题的讨论》 张静
98:00 《AI驱动的智慧人才技术体系》 张鹏
119:50 《认知与推荐系统》 周畅
144:20 《思辨 推荐系统》 多人
二、思辨推荐系统
论道推荐系统之“效率”
人员:张静(人大)、程祥(北邮)、张敏(清华)、陈炜鹏(搜狗)、张鹏(北京智谱华章科技有限公司CTO)
内容:
(1)推荐的本质是满足用户可能自身都不知道的喜好需求。 推荐=你猜?
推荐场景,内容生态,关注用户的满足性,算法精准性。
(2)信息流推荐、商品推荐。
一个场景下互补、同类推荐。买手机1-2年不推荐手机,买牛奶10来天就推荐。
(3)召回率、准确率是基本的评测指标
实际应用中还是用户的反馈。
(4)推荐系统黏住用户,公司-用户,计算广告更多是流量变现,商业(公司-用户-广告主)。
(1)图结构复杂性与推荐结果召回率的矛盾
通用性图谱、垂直(专用)图谱
图表示学习能很好建模用户-物品关系,计算效率瓶颈
知识图谱用于推荐:RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems,论文发表于CIKM2018。
(2)知识图谱
可解释性:2012年张敏团队挖掘用户评论文本方面特征。
图谱、图片解释,一图胜千言。
解释会不会带来信息的bais,怎么保证解释的准确性,怎么评价解释的好坏?
端到端没有过程,不可解释,
端到端,拆解成若干段,每一段看看能不能解释。
Neual model 方法增加可解释性:(1)中间加探针,每个阶段输出清楚(2)比如说用一个决策树模型与一个Neual model共同学习,一起出了结果。Neual model虽然不可解释,但是决策树模型可以(3)加入logical到Neual model,神经元有含义了。
神经网络+Attention也可以具有可解释性
可解释性可要看场景。
(3)离线、在线实验差别
离线:设定了统一的标准,横线比较,自己方法与别人方法的差异。 AUC、NDCG等评价指标
在线:自身和自身的比较,算法更新迭代后效果是否有变化? eg:A/B Test,很多在线实验没法重复,因为今天推荐这个了,不可能明天还给他推荐这个。人本身有bias.
必须在离线实验效果很好了,才能在线实验试一试。离线效果好,不一定在线效果好。
推荐系统是一个动态的系统,比如新闻推荐。用户需求动态变化。 用户点击率、阅读率、时长。短期目标与长期目标。
如何评价在线实验的指标,很难。CTR、时长,怎么侧面反映用户满意度?
用户行为太难分析了,建模还是比较理想化的。
(4)推荐系统与用户隐私的平衡
结合联邦学习,数据不动,隐私计算的技术。数据可用不可见。
(1)召回、排序、重排序
召回效率高,漏斗一层层减少。
用户的多兴趣表示
排序:deepfm
推荐系统结合心理学研究。认知心理学、群体心理学。
(2)并行计算、并行机器学习 ——效率
线上、线下计算结合
双塔(线上计算转化到线下计算)
(3)
ACL 2020 | 微软发布大规模新闻推荐数据集MIND,开启新闻推荐比赛
复杂性、系统工程角度解决问题。
隐私性
公平性(用户、物品),用基尼系数评价
Cold-start