【AI TIME 2020年中国科技峰会系列活动青年科学家沙龙】记录

一、直播视频回放地址:

https://www.bilibili.com/video/BV16D4y1o7YS?p=1&share_medium=android&share_plat=android&share_source=COPY&share_tag=s_i&timestamp=1601175365&unique_k=hZcenF

2:20 《智能人机互动》 喻纯 <- 打call
24:15 《基于迁移学习的任务型对话系统研究》 车万翔
46:00 《因果推理赋能推荐系统初探》 冯福利
76:30 《知识图谱融合中歧义性与异质性问题的讨论》 张静
98:00 《AI驱动的智慧人才技术体系》 张鹏
119:50 《认知与推荐系统》 周畅
144:20 《思辨 推荐系统》 多人

二、思辨推荐系统

论道推荐系统之“效率”

人员:张静(人大)、程祥(北邮)、张敏(清华)、陈炜鹏(搜狗)、张鹏(北京智谱华章科技有限公司CTO

内容:

 (1)推荐的本质是满足用户可能自身都不知道的喜好需求。  推荐=你猜?

推荐场景,内容生态,关注用户的满足性,算法精准性。

(2)信息流推荐、商品推荐。

一个场景下互补、同类推荐。买手机1-2年不推荐手机,买牛奶10来天就推荐。

(3)召回率、准确率是基本的评测指标

实际应用中还是用户的反馈。

(4)推荐系统黏住用户,公司-用户,计算广告更多是流量变现,商业(公司-用户-广告主)。

(1)图结构复杂性与推荐结果召回率的矛盾

通用性图谱、垂直(专用)图谱

图表示学习能很好建模用户-物品关系,计算效率瓶颈

知识图谱用于推荐:RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems论文发表于CIKM2018。

(2)知识图谱

可解释性:2012年张敏团队挖掘用户评论文本方面特征。

图谱、图片解释,一图胜千言。

解释会不会带来信息的bais,怎么保证解释的准确性,怎么评价解释的好坏?

端到端没有过程,不可解释,

端到端,拆解成若干段,每一段看看能不能解释。

Neual model 方法增加可解释性:(1)中间加探针,每个阶段输出清楚(2)比如说用一个决策树模型与一个Neual model共同学习,一起出了结果。Neual model虽然不可解释,但是决策树模型可以(3)加入logical到Neual model,神经元有含义了。

神经网络+Attention也可以具有可解释性

可解释性可要看场景。

(3)离线、在线实验差别

离线:设定了统一的标准,横线比较,自己方法与别人方法的差异。 AUC、NDCG等评价指标

在线:自身和自身的比较,算法更新迭代后效果是否有变化?  eg:A/B Test,很多在线实验没法重复,因为今天推荐这个了,不可能明天还给他推荐这个。人本身有bias.

必须在离线实验效果很好了,才能在线实验试一试。离线效果好,不一定在线效果好。

推荐系统是一个动态的系统,比如新闻推荐。用户需求动态变化。 用户点击率、阅读率、时长。短期目标与长期目标。

如何评价在线实验的指标,很难。CTR、时长,怎么侧面反映用户满意度?

用户行为太难分析了,建模还是比较理想化的。

(4)推荐系统与用户隐私的平衡

结合联邦学习,数据不动,隐私计算的技术。数据可用不可见。

(1)召回、排序、重排序

召回效率高,漏斗一层层减少。

用户的多兴趣表示

排序:deepfm

推荐系统结合心理学研究。认知心理学、群体心理学。

(2)并行计算、并行机器学习 ——效率

线上、线下计算结合

双塔(线上计算转化到线下计算)

(3)

ACL 2020 | 微软发布大规模新闻推荐数据集MIND,开启新闻推荐比赛

复杂性、系统工程角度解决问题。

隐私性

公平性(用户、物品),用基尼系数评价

Cold-start 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值