KDD 2019高维稀疏数据上的深度学习Workshop论文汇总

本文简要总结一下阿里妈妈在KDD 2019上组织的第一届面向高维稀疏数据的深度学习实践Workshop[1]收录的论文。 
欢迎转载,转载请注明出处以及链接,更多关于深度推荐系统优质内容请关注如下频道。
知乎专栏:深度推荐系统 
微博:深度传送门 
公众号:深度传送门

今年阿里妈妈在KDD 2019上组织了第一届面向高维稀疏数据的深度学习实践Workshop(官网:https://dlp-kdd.github.io),看这个名字就知道极具推荐、广告领域工业界的大规模深度学习色彩。虽然这次收录的论文主要是来自阿里巴巴和中国高校,但毕竟是基于工业界大规模实际场景需求出发组织的研讨会还是可以多多见识下大家讨论的一些topic和idea。也借此祝愿这样的研讨会举办得更多一些,越来越有含金量越来越有影响力。

User Behavior Understanding

1. (Best Paper Award) An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendationt.cn/AiQwCNck;代码:t.cn/AiQgYOrI;

提出KNI模型引入KG以及GNN更好地学习用户-item之间复杂的结构交互模式,解决CTR预估中数据稀疏与冷启动问题,效果好于WDL和DKN等。并开源了代码。

2. Collaborative Filtering via Learning Characteristics of Neighborhood based on Convolutional Neural Networkst.cn/Ai8PIxvF;

借助CNN抽取临近item的特征,更好地学习用户-item之间的隐式关系来提升CF类算法的准确性。效果好于NCF等。

3. Attention-based Mixture Density Recurrent Networks for History-based Recommendationt.cn/Ai8hcGut;

提出引入注意力机制的RNN网络来建模基于向量表示的用户历史,动态预测用户的点击、购买行为等。效果主要和经典的ICF、IMF等在两大公开数据集上进行了对比有明显提升。

4. Behavior Sequence Transformer for E-commerce Recommendation in Alibabat.cn/Ai8hSGwk;

将Transformer的自注意力结构引入推荐系统中典型的MLP+embedding网络结构中,在淘宝线上CTR预估任务中效果好于WDL和DIN等。

5. Click-Through Rate Prediction with the User Memory Networkt.cn/AiW9R5PL;代码:t.cn/AiW9R5Pq;

提出MA-DNN(Memory Augmented DNN)综合考虑CTR预估工业界性能与效率的折中,既像DNN简单,又能像RNN针对用户复杂历史行为进行建模。主要是为每个用户新增了两个记忆向量来对用户喜欢和不喜欢的概率进行建模,效果好于WDL并开源了代码。

6. A unified Neural Network Approach to e-Commerce Relevance Learningt.cn/Ai8hOzRe;

来自京东的研究者们提出一种普适的前向网络框架预测query和item的相关性,同时引进了多项优化手段Siamese pairwise框架、随机负样本Batch训练以及pointwise调优等,效果好于DSSM和GBDT等。

Representation Learning for High-dimensional Sparse Data

7. Pairwise Multi-Layer Nets for Learning Distributed Representation of Multi-field Categorical Datat.cn/Ai8htYEM;代码:t.cn/Ai8h3mWq;

提出一种基于Pairwise多层网络来学习多值类别特征的表示方法。针对每一个类别特征的每一个离散field都学习一个低维向量,然后依靠网络门学习特征内和特征间的交互。在CTR预估任务中,效果好于FNN和PNN等。

8. Learning over Categorical Data using Counting Featurest.cn/Ai8hkttg;

针对目前多值类别特征的one-hot编码的诸多问题提出一种新颖的counting features方式,在CTR预估任务中具有更好的泛化能力。

9. Learning Job Representation Using Directed Graph Embeddingt.cn/Ai8hFbGi;

提出仿照经典的Graph Embedding方式从用户的job转换历史构图学习job的的Embedding表示,效果好于skip-gram等。

Embedding techniques

10. Res-embedding for Deep Learning Based Click-Through Rate Prediction Modelingt.cn/Ai87wZyp;

针对CTR预估任务中经典的Embedding&MLP结构中Embedding表示学习泛化能力差的问题提出了一种叫做res-embedding的方式。由两部分构成:一部分是基于item的兴趣图学习的central embedding;另一部分是相对小维度的residual embedding。

11. SuperChat: Dialogue Generation by Transfer Learning from Vision to Language using Two-dimensional Word Embeddingt.cn/Ai87UMHa;

借助文本分类中Super Characters的两维embedding方式,应用在会话生成当中。

Auto feature selection

12. Automatic Feature Engineering From Very High Dimensional Event Logs Using Deep Neural Networkst.cn/Ai87bepi;

提出Midway NN网络针对高维事件日志进行自动特征工程。MNN将特定窗口的输入特征向量转换为稠密的中间特征表示并进行缓存,供增量学习和预测。实验证明可以减少人工参与,以及节省训练和预测的耗时。

Scalable, Distributed and Parallel Training System for Deep Learning

13. XDL: An Industrial Deep Learning Framework for High-dimensional Sparse Datat.cn/Ai87tBXC;

阿里妈妈自研的面向推荐、广告领域高维稀疏数据的深度学习框架XDL。

Anomaly detection

14. An Adaptive Approach for Anomaly Detector Selection and Fine-tuning in Time Seriest.cn/Ai87cpbF;

15. AMAD: Adversarial Multiscale Anomaly Detection on High-Dimensional and Time-Evolving Categorical Datat.cn/Ai87c3SC;

参考

  1. The 1st International Workshop on Deep Learning Practice for High-Dimensional Sparse Data with KDD 2019 (DLP-KDD 2019)

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
类似于KDDCup99的数据集是指用于网络入侵检测的数据集。KDDCup99是一个公开的网络入侵检测数据集,其中包含了许多模拟真实网络环境中的网络流量数据。这个数据集是在1999年KDDKnowledge Discovery in Databases)会议上举办的一个竞赛中使用的,旨在推动网络入侵检测研究的发展。 类似于KDDCup99的数据集通常具有以下特点: 1. 数据规模庞大,包含大量的网络流量数据。这些数据可以是网络连接记录、网络包数据等。 2. 数据集中通常包括多种类型的网络流量,如正常流量、恶意流量、已知的攻击流量等。 3. 数据集中的网络流量数据通常经过了标记或标注,以表示不同的网络行为,如正常、攻击、异常等。 4. 数据集中的网络流量数据可以用于网络入侵检测算法的训练和评估。通过对数据集的分析和建模,可以提高网络入侵检测系统的效率和准确性。 5. 数据集中的网络流量数据可以用于研究网络入侵的特征、行为以及攻击方式等。通过对数据集的分析,可以揭示网络入侵的模式和规律。 类似于KDDCup99的数据集的使用对于网络入侵检测研究和实践非常有价值。它提供了一个标准的数据集,使得不同的研究人员和团队可以进行比较和验证。同时,通过对数据集的研究和分析,可以为网络入侵检测系统的改进和优化提供重要的参考。因此,类似于KDDCup99的数据集在网络安全领域具有重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值