文本匹配
文章平均质量分 51
小菜狗很无敌
这个作者很懒,什么都没留下…
展开
-
Bilateral Multi-Perspective Matching for Natural Language Sentences论文笔记
自然语言句子的双向多视角匹配INTRODUCTION自然语言句子匹配(NLSM)是指对两个句子比较,确定他们的关系,可以完成释义识别,判断两个是否有释义;对于自然语言推理任务,用来判断假设句是否可以从前提句中推断出来;对于问答和信息检索任务,用于评估问答对之间的相关性;对于机器理解任务,用于匹配文章与问题。目前有两种用于NLSM的深度学习框架,第一种是基于“孪生”结构,将同一个神经编码器分别应用于两个输入句子,使这两个句子都被编码到同一个嵌入空间的句子向量中,然后基于这两个句子向量进行匹配。这个框架的原创 2021-05-25 17:12:55 · 333 阅读 · 0 评论 -
CUDA error: device-side assert triggered 解决方法
cuda看不出错误信息,所以用cpu跑**错误在这里embedding有40000个词,却尝试找索引值为43158的词向量原创 2021-05-13 11:11:06 · 3847 阅读 · 1 评论 -
文本匹配数据预处理-部分代码记录
with open(‘embedding/glove.6B.300d.txt’, ‘r’,encoding=‘gb18030’, errors=‘ignore’) as file1:for line in file1.readlines():row = line.strip().split(’ ')vocab.append(row[0])f = open(“embedding/vocab.txt”, “w”,encoding=‘gb18030’, errors=‘ignore’)for line原创 2021-05-12 17:19:54 · 222 阅读 · 0 评论 -
文本匹配ABCNN-pytorch代码遇到的问题及解决方法
问题1:数据集为txt,转为为csv时,逗号会成为分割符号。解决:在txt文件数据中的逗号后面加一个空格问题2:解决:加上“sep=’\t’, header=0”减少数据量后运行结果:原创 2021-05-11 15:25:05 · 219 阅读 · 0 评论