本文同步发表在 PaperWeekly
EMNLP 2019开源论文:针对短文本分类的异质图注意力网络mp.weixin.qq.com![8847b1c8ed33a7de073e649fc52f4ab5.png](https://i-blog.csdnimg.cn/blog_migrate/5af756e7d2925f54bd0695a752d3cbe3.jpeg)
本文由北邮和南洋理工联合发表在自然语言处理顶会 EMNLP 2019 上并开源了代码和数据(http://shichuan.org/ )。
![7ad965a68238f63a52ff14d43b38e164.png](https://i-blog.csdnimg.cn/blog_migrate/399438894a13a8065ae1c658f95df4ca.jpeg)
![d2c5d2b3758c1edac90ee85a68737361.png](https://i-blog.csdnimg.cn/blog_migrate/d6ff92fd4998ca69f6cbb9914efca63e.jpeg)
论文动机
短文本分类在新闻及微博等领域得到了广泛的应用。但是,目前的文本分类算法主要集中于长文本分类并且无法直接应用于短文本分类。这是由于短文本分类的两个独有挑战:
1. 数据的稀疏和歧义:短文本通常不超过 10 个词,提供的信息非常有限。经典的 Bi-LSTM+Attention 往往无法有效的捕获短文本中的语义信息。
2. 标签数量较少:传统的监督学习无法有效工作,尤其是传统深度学习算法需要大量的监督数据。
针对上述两个挑战,本文创新地将短文本建模为异质图(见 Figure 1),通过图数据的复杂交互来解决数据稀疏和歧义带来的挑战。同时,本文提出了一种异质图注意力 HGAT 来学习短文本的表示并进行分类。HGAT 是一种半监督学习算法可以更好的适用于标签数量较少的场景,如短文本的分类。
![f0dc3e36d1c5503bce2a00882b333de8.png](https://i-blog.csdnimg.cn/blog_migrate/49892946b7034cec3ba5c999803fa15e.jpeg)
HGAT
本文提出 Heterogeneous Graph Attention Network 来学习短文本异质图的表示。考虑到短文本所建模的异质图的特点,HGAT设计了 dual-level attention mechanism,包括 node level 和 type level,来更好的学习短文本的表示。模型架构图如 Figure 2 所示。