论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

代码源文件:EmbeddingSimilarityEvaluator.py

文中的相似度测评距离

距离测评公式文章整理
相似度距离测评方法主要有:
余弦距离、曼哈顿距离、欧式距离、dot product

cosine_scores = 1 - (paired_cosine_distances(embeddings1, embeddings2))
manhattan_distances = -paired_manhattan_distances(embeddings1, embeddings2)# 一维范式
euclidean_distances = -paired_euclidean_distances(embeddings1, embeddings2)# 二维范式
dot_products = [np.dot(emb1, emb2) for emb1, emb2 in zip(embeddings1, embeddings2)]

在这里插入图片描述

相似度测评方法效果评估

使用了两种相关系数:pearson 相关系数和spearman相关系数

eval_pearson_cosine, _ = pearsonr(labels, cosine_scores)
eval_spearman_cosine, _ = spearmanr(labels, cosine_scores)

1. pearson 相关系数

在这里插入图片描述

2.spearman相关系数

原文链接:原文

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
【资源介绍】 Python基于BERT的中文文本相似度识别模型源码+项目说明.zipPython基于BERT的中文文本相似度识别模型源码+项目说明.zip 无监督学习:向量白化、对比学习 bertwhitening:bert输出向量白化 论文:Whitening Sentence Representations for Better Semantics and Faster Retrieval 训练数据:lcqmc随机选取10000语句,抛弃标签。 SimCSE_unsupervised:采用与论文相同的损失函数 论文:SimCSE: Simple Contrastive Learning of Sentence Embeddings 训练数据:lcqmc随机选取10000语句,抛弃标签。 SimCSE_unsupervised_sp:采用与苏剑林相同的损失函数 训练数据:同上 SimCSE_unsupervised_sp_simplified:采用与苏剑林相同的损失函数,从transformers加载bert 训练数据:同上 SimCSE_unsupervised_simplified:采用与论文相同的损失函数,从transformers加载bert 训练数据:同上 ConSERT_unsupervised_shuffle:对posids进行shuffle 论文:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer 训练数据:同上 ESimCSE_unsupervised_endpoints: 采用与论文相同的损失函数 论文:ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding 训练数据:同上 ## 监督学习:双塔模型、对比学习 SBERT:SentenceBERT 论文Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks 训练数据:lcqmc训练集 SBERT:SentenceBERT_simplified, 从transformers加载bert 论文:同上 训练数据:同上 SimCSE_supervised:采用与论文相同的损失函数 训练数据:snli随机选取10000条数据,数据格式[sentence,sentence_entailment,sentence_contradiction] 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,也适用于小白学习入门进阶。当然也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或者热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载,沟通交流,互相学习,共同进步!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值