本文简要总结一下阿里妈妈在KDD 2019上组织的第一届面向高维稀疏数据的深度学习实践Workshop[1]收录的论文。
欢迎转载,转载请注明出处以及链接,更多关于深度推荐系统优质内容请关注如下频道。
知乎专栏:深度推荐系统
微博:深度传送门
公众号:深度传送门
今年阿里妈妈在KDD 2019上组织了第一届面向高维稀疏数据的深度学习实践Workshop(官网:https://dlp-kdd.github.io),看这个名字就知道极具推荐、广告领域工业界的大规模深度学习色彩。虽然这次收录的论文主要是来自阿里巴巴和中国高校,但毕竟是基于工业界大规模实际场景需求出发组织的研讨会还是可以多多见识下大家讨论的一些topic和idea。也借此祝愿这样的研讨会举办得更多一些,越来越有含金量越来越有影响力。
User Behavior Understanding
1. (Best Paper Award) An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendationt.cn/AiQwCNck;代码:t.cn/AiQgYOrI;
提出KNI模型引入KG以及GNN更好地学习用户-item之间复杂的结构交互模式,解决CTR预估中数据稀疏与冷启动问题,效果好于WDL和DKN等。并开源了代码。
2. Collaborative Filtering via Learning Characteristics of Neighborhood based on Convolutional Neural Networkst.cn/Ai8PIxvF;
借助CNN抽取临近item的特征,更好地学习用户-item之间的隐式关系来提升CF类算法的准确性。效果好于NCF等。
3. Attention-based Mixture Density Recurrent Networks for History-based Recommendationt.cn/Ai8hcGut;
提出引入注意力机制的RNN网络来建模基于向量表示的用户历史,动态预测用户的点击、购买行为等。效果主要和经典的ICF、IMF等在两大公开数据集上进行了对比有明显提升。
4. Behavior Sequence Transformer for E-commerce Recommendation in Alibabat.cn/Ai8hSGwk;
将Transformer的自注意力结构引入推荐系统中典型的MLP+embedding网络结构中,在淘宝线上CTR预估任务中效果好于WDL和DIN等。
5. Click-Through Rate Prediction with the User Memory Networkt.cn/AiW9R5PL;代码:t.cn/AiW9R5Pq;
提出MA-DNN(Memory Augmented DNN)综合考虑CTR预估工业界性能与效率的折中,既像DNN简单,又能像RNN针对用户复杂历史行为进行建模。主要是为每个用户新增了两个记忆向量来对用户喜欢和不喜欢的概率进行建模,效果好于WDL并开源了代码。
6. A unified Neural Network Approach to e-Commerce Relevance Learningt.cn/Ai8hOzRe;
来自京东的研究者们提出一种普适的前向网络框架预测query和item的相关性,同时引进了多项优化手段Siamese pairwise框架、随机负样本Batch训练以及pointwise调优等,效果好于DSSM和GBDT等。
Representation Learning for High-dimensional Sparse Data
7. Pairwise Multi-Layer Nets for Learning Distributed Representation of Multi-field Categorical Datat.cn/Ai8htYEM;代码:t.cn/Ai8h3mWq;
提出一种基于Pairwise多层网络来学习多值类别特征的表示方法。针对每一个类别特征的每一个离散field都学习一个低维向量,然后依靠网络门学习特征内和特征间的交互。在CTR预估任务中,效果好于FNN和PNN等。
8. Learning over Categorical Data using Counting Featurest.cn/Ai8hkttg;
针对目前多值类别特征的one-hot编码的诸多问题提出一种新颖的counting features方式,在CTR预估任务中具有更好的泛化能力。
9. Learning Job Representation Using Directed Graph Embeddingt.cn/Ai8hFbGi;
提出仿照经典的Graph Embedding方式从用户的job转换历史构图学习job的的Embedding表示,效果好于skip-gram等。
Embedding techniques
10. Res-embedding for Deep Learning Based Click-Through Rate Prediction Modelingt.cn/Ai87wZyp;
针对CTR预估任务中经典的Embedding&MLP结构中Embedding表示学习泛化能力差的问题提出了一种叫做res-embedding的方式。由两部分构成:一部分是基于item的兴趣图学习的central embedding;另一部分是相对小维度的residual embedding。
11. SuperChat: Dialogue Generation by Transfer Learning from Vision to Language using Two-dimensional Word Embeddingt.cn/Ai87UMHa;
借助文本分类中Super Characters的两维embedding方式,应用在会话生成当中。
Auto feature selection
12. Automatic Feature Engineering From Very High Dimensional Event Logs Using Deep Neural Networkst.cn/Ai87bepi;
提出Midway NN网络针对高维事件日志进行自动特征工程。MNN将特定窗口的输入特征向量转换为稠密的中间特征表示并进行缓存,供增量学习和预测。实验证明可以减少人工参与,以及节省训练和预测的耗时。
Scalable, Distributed and Parallel Training System for Deep Learning
13. XDL: An Industrial Deep Learning Framework for High-dimensional Sparse Datat.cn/Ai87tBXC;
阿里妈妈自研的面向推荐、广告领域高维稀疏数据的深度学习框架XDL。
Anomaly detection
14. An Adaptive Approach for Anomaly Detector Selection and Fine-tuning in Time Seriest.cn/Ai87cpbF;
15. AMAD: Adversarial Multiscale Anomaly Detection on High-Dimensional and Time-Evolving Categorical Datat.cn/Ai87c3SC;
参考
The 1st International Workshop on Deep Learning Practice for High-Dimensional Sparse Data with KDD 2019 (DLP-KDD 2019)