- 博客(5)
- 收藏
- 关注
原创 短文本匹配
在NLP中,会遇到这样的一个应用问题如何将文本中的某个短语/实体归一化为(对齐)某个标准名?解决该问题的办法很多,比如使用近义词词库进行匹配,或检索词语类的知识库(HowNet),也可用word2vec之类的词向量技术进行cosine相似计算。再高级点,可利用像BERT之类的预训练模型进行预测。但是上述的方法都存在一个共同的缺陷,都没考虑关键词所在的语义环境。基于这个问题,有两个方法来解决。...
2022-08-01 10:15:50 473 1
原创 Siamese Network 相似度度量
Siamese网络是一种相似性度量方法,当类别数多,但每个类别的样本数量少的情况下可用于类别的识别、分类等。Siamese网络从数据中去学习一个相似性度量,用这个学习出来的度量去比较和匹配新的未知类别的样本。这个方法能被应用于那些类别数多或者整个训练样本无法用于之前方法训练的分类问题。...
2022-07-05 11:03:36 668
原创 语义相似度计算(DSSM)
语义相似度的两个方面:召回和排序。在召回时,传统的文本相似性如 BM25,无法有效发现语义类 query-Doc 结果对,DSSM(Deep Structured Semantic Models)为计算语义相似度提供了一种思路。DSSM既可以用来预测两个句子的语义相似度,又可以获得某句子的低纬语义向量表达。...
2022-06-09 15:29:32 1780
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人