问题匹配/文本匹配数据集（自用）

啥时候才能确定方向

已于 2022-07-11 10:32:47 修改

阅读量1.3k

点赞数

文章标签：机器学习自然语言处理人工智能

于 2022-07-08 11:52:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44125942/article/details/125674778

版权

这篇博客整理了多个中文语义匹配数据集，包括AFQMC、BUSTM、LCQMC等，适用于智能客服和对话系统的语义相似度评估。提供了数据集链接和样本，以及一些基础的语义匹配模型如BERT和ERNIE。

摘要由CSDN通过智能技术生成

问题匹配（question matching）/Chinese Sentence Pair Classification：

1、AFQMC 蚂蚁金融语义相似度 Ant Financial Question Matching Corpus

1）Gitee库
数据量：训练集（34334）验证集（4316）测试集（3861）
例子：
{“sentence1”: “双十一花呗提额在哪”,
“sentence2”: “里可以提花呗额度”,
“label”: “0”}

2）蚂蚁金融NLP竞赛数据集
https://pan.baidu.com/share/init?surl=BIgFyK_kmJU4QwbLL82Hxg
5ig5
来源：https://blog.csdn.net/u014732537/article/details/81038260
（好像两个不是一个数据集）

2、BUSTM 小布助手对话短文本匹配数据集 XiaoBu Dialogue Short Text Matching

竞赛数据集

Gitee库：
eg：
{“id”: 5,
“sentence1”: “女孩子到底是不是你”,
“sentence2”: “你不是女孩子吗”,
“label”: “1”}

最低0.47元/天解锁文章

啥时候才能确定方向

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

啥时候才能确定方向 CSDN认证博客专家 CSDN认证企业博客

码龄6年

12: 原创

107万+: 周排名

57万+: 总排名

2万+: 访问

: 等级

161: 积分

5: 粉丝

27: 获赞

3: 评论

113: 收藏

私信

关注

热门文章

分类专栏

论文阅读 1篇

最新评论

Optimizing Sharded Collections in MongoDB with Defragmentation-翻译
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题"Optimizing Sharded Collections in MongoDB with Defragmentation-翻译"听起来非常有深度，我对您的持续创作感到非常兴奋。您对MongoDB的优化和碎片整理的讨论引起了我的兴趣。我期待能够阅读您的文章，了解如何通过碎片整理来提高MongoDB的性能。在下一步的创作中，我建议您继续探索MongoDB的其他优化技术。比如，您可以探讨索引的最佳实践，或者介绍如何优化查询性能。当然，这只是我谦虚的建议，您对自己的创作方向最了解。再次祝贺您的成就，期待您未来更多有价值的文章！
Incremental StreamQuery Merging-论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
问答数据集（自用，持更）
抖抖抖抖: 哈哈哈哈哈这个对于数据网站的评价我笑晕了
问答数据集（自用，持更）
花咪: mark 3q

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。