自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 短文本匹配

在NLP中,会遇到这样的一个应用问题如何将文本中的某个短语/实体归一化为(对齐)某个标准名?解决该问题的办法很多,比如使用近义词词库进行匹配,或检索词语类的知识库(HowNet),也可用word2vec之类的词向量技术进行cosine相似计算。再高级点,可利用像BERT之类的预训练模型进行预测。但是上述的方法都存在一个共同的缺陷,都没考虑关键词所在的语义环境。基于这个问题,有两个方法来解决。...

2022-08-01 10:15:50 473 1

原创 Sentence-Bert论文笔记

本文总体介绍了文本匹配任务中在Siamse Network基础上改进而来的Sentence-BERT模型。

2022-07-27 16:45:47 652

原创 BERT预训练语言模型

BERT预训练语言模型

2022-07-05 12:01:57 1280

原创 Siamese Network 相似度度量

Siamese网络是一种相似性度量方法,当类别数多,但每个类别的样本数量少的情况下可用于类别的识别、分类等。Siamese网络从数据中去学习一个相似性度量,用这个学习出来的度量去比较和匹配新的未知类别的样本。这个方法能被应用于那些类别数多或者整个训练样本无法用于之前方法训练的分类问题。...

2022-07-05 11:03:36 668

原创 语义相似度计算(DSSM)

语义相似度的两个方面:召回和排序。在召回时,传统的文本相似性如 BM25,无法有效发现语义类 query-Doc 结果对,DSSM(Deep Structured Semantic Models)为计算语义相似度提供了一种思路。DSSM既可以用来预测两个句子的语义相似度,又可以获得某句子的低纬语义向量表达。...

2022-06-09 15:29:32 1780

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除