![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文笔记
BigPig_LittleTail
这个作者很懒,什么都没留下…
展开
-
论文笔记《Knowledge Enhanced Contextual Word Representations》
Motivition作者的出发点有几个:尽管BERT这种预训练模型取得了state-of-art的成绩。但是、因为他们没有包含真实世界的实体,所以导致这些模型也很难覆盖真实世界的知识。没有实体没有知识怎么办呢?Knowledge bases、知识库有。知识库不仅拥有丰富的高质量、人类产生的知识,而且他们包含与原始文本中互补的信息,还能够编码事实性的知识。所以用知识库可以解决因不频繁出现但...原创 2020-02-26 10:46:08 · 3903 阅读 · 0 评论 -
《A Self-Training Approach for Short Text Clustering》论文笔记
A Self-Training Approach for Short Text Clustering这是一篇关于短文本聚类的文章。“因为随着社交媒体的广泛使用,短文本已经成为web上流行的文本形态。然而与长文本不同,使用词袋模型和TF-IDF表示的短文本存在着稀疏的问题。”短文本的稀疏问题假设有短文本数据集X={x1,x2…xn}。对于xi∈X,假设xi中的词汇数为ni,那么数据集X的...原创 2019-10-16 20:58:54 · 1655 阅读 · 1 评论