自然语言处理
文章平均质量分 78
hionechance
专注于计算机视觉、推荐系统方向研究与实践,欢迎交流
展开
-
Siamese Network 孪生网络简介
0. 写在前面“匹配”这类任务有着很广泛的应用场景,例如NLP中的文本匹配,推荐领域的物品召回等任务。由此,学术界和工业界提出了很多不同的方法和模型来解决匹配问题,并致力于效果提升。本篇文章介绍一种经典的网络模型Siamese Network(孪生神经网络),该模型能够处理但不局限于“匹配”问题,下面一起来看下。个人心得:Siamese Network中,两个输入共享编码层(嵌入层);通过调整Siamese Network的特征变换层及损失函数,能够使其适用于不同的任务。Wikipedia:原创 2021-01-23 19:36:35 · 733 阅读 · 0 评论 -
文本匹配模型TextMatching
0. 写在前面本次分享一篇NLP文本匹配的经典文章,主要思路是借鉴图像识别的思路来解决NLP文本匹配问题,毕竟计算机视觉技术的发展在当时异常迅猛。个人心得:文本匹配问题可转化为二分类问题,输出概率则为相似度将图像识别的思路应用于文本匹配任务中,利用卷积抽取文本特征论文地址:https://arxiv.org/pdf/1602.06359.pdf1. 背景文本匹配广泛用于搜索引擎、问答系统、信息流相关文章推荐等场景中,目的是为了在文本库中找出与目标文本类似或相关的文本。本文即将介绍的Tex原创 2021-01-23 19:35:38 · 634 阅读 · 0 评论 -
fastText简介与实践
0. 写在前面在fastText问世以前,线性模型在文本分类任务中占据了主要地位,如果选用了正确的特征,往往能取得不错的效果。但是,其模型简单成为线性模型发展的瓶颈。神经网络具备高阶特征拟合能力,适用于各类复杂场景。fastText就是一种将DNN应用于文本分类的经典工作,并且在当时取得了SOTA的效果。个人心得:字符级n-gram,将单词拆分为子字符串,并分别训练embedding后叠加得到单词embedding。能够学习到单词词形,并且可以处理未登录词的embeddingfastText可用于原创 2021-01-23 19:30:56 · 396 阅读 · 1 评论