利用深度学习查找"相似问题"——Quora技术实践

原文:Semantic Question Matching with Deep Learning
作者:Lili Jiang, Shuo Chang, and Nikhil Dandekar
编译:赵屹华
欢迎人工智能领域技术投稿、约稿、给文章纠错,请发送邮件至[email protected]

Quora作为一个高质量的知识平台,需要确保相同的问题不会多次出现。答题者不应该把相同的答案复制粘贴到类似的问题下方,而读者也应该只能在站内找到唯一的问题与他的需求对应。例如,“减体重的最佳方法是什么?”,“如何才能减肥?”,“最有效的减肥计划是什么?”,通常这些问题都会被人们认为是重复提问,因为这些问题的意图都相同。为了避免出现类似的问题,Quora的工程师们利用机器学习和自然语言处理技术,开发了一套自动识别重复问题的系统。

最近,Quora的工程师们公开了一个重复问题的数据集,供爱好者们训练模型,来解决类似于Quora重复提问检测的任务。在此篇文章中,笔者会介绍Quora工程师在过去几周内将这份数据集与深度学习技术相结合,做了哪些探索性的研究。

问题定义

严格来说,重复检测的问题可以定义为这类形式

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值