【论文笔记 2】Topic-Aware Neural Keyphrase Generation for Social Media Language（ACL19）

最新推荐文章于 2024-04-22 15:48:49 发布

NEU_XXQ

最新推荐文章于 2024-04-22 15:48:49 发布

阅读量545

点赞数 1

分类专栏： NLP 文章标签： nlp 人工智能 acl 机器学习自然语言处理

本文链接：https://blog.csdn.net/NEU_XXQ/article/details/114630303

版权

8 篇文章 2 订阅

订阅专栏

社交媒体下的主题感知和关键词

题目：Topic-Aware Neural Keyphrase Generation for Social Media Language

作者：Yue Wang1∗ Jing Li2† Hou Pong Chan1 Irwin King1 Michael R. Lyu1 Shuming Shi2

作者单位：腾讯AiLab+港中大

发表会议：ACL

发表年限：19

背景：在庞大的社交媒体流中有效地自动提取主题。

解决问题：解决社交媒体稀疏信息中的主题提取问题（关键短语预测）

采用方法：DL方法，VAE+GRU（Bi-GRU GRU）

从帖子中提取单词或短语作为帖子的主题表示

限制：无法产生帖子中没有的词语，这些有时候包含了关键的信息。同时在社交媒体的文本中，这种情况较为常见，因为用户在日常交流中倾向于简写或用一些其他词语指代。
对一般文本的方法在处理社交语料的时候，不可避免会遇到数据稀疏的问题

限制：在单独看某一个微博或推文的时候，有时候很难知道其具体在讲什么东西

关键工作：

框架架构：
在这里插入图片描述

核心：主题模型+生成模型

主题模型（下方绿色）：

采用NTM，这里的架构与Miao的NVDM-GSM一样，输出输出都是词袋模型。过程为对词袋模型的表示和重构。对隐空间的约束采用KL散度。隐空间学习到的Z即为主题分布，该部分的目的是获取隐含的主题。
生成模型（上方）：

输入为序列模型和主题分布，输出为可以描述主题的一个单词序列。标准的seq2seq结构

数据集：

在不使用潜在主题的情况下，优于现有模型

使用潜在主题在社交媒体流这样的文法不严格的语料上（noisy）表现更好。

关注