BUPTTeam Participation in NTCIR-12 Short Text Conversation Task

最新推荐文章于 2024-12-17 15:23:12 发布

imperfect00

最新推荐文章于 2024-12-17 15:23:12 发布

阅读量373

点赞数

分类专栏： NLP

本文链接：https://blog.csdn.net/u011961856/article/details/77433438

版权

NLP 专栏收录该内容

28 篇文章

订阅专栏

系统架构为:

这里写图片描述

1.1预处理

首先对多有的对话对进行文本处理,如繁体转换为简体,过滤特殊字符,英文字符,数字处理等,并对处理好的文本进行分词处理.

1.2建立索引

使用Elasticsearch方法

1.3生成候选query

由Elasticsearch方法得到top10个候选的query,再有得到的query通过Elasticsearch算法得到对应的10个response,

Elasticsearch算法:

对于query p 和c,计算他们的得分为:

$score(p,c)=pm(p)*cd(p,c)*tf(p)*idf(c)*nm(c)$

$pm(p)=1/\sqrt{\sum_{w_i\in set(p)}idf^2(w_i)}$

$idf(w_i)=1+log_e^{\frac{numDocs}{docFreg+1}}$

$cd(p,c)=\frac{|set(p\bigcap set(c))|}{|set(p)|}$

$|set(p)|$ $表示$ $set(p)$ 中的词的个数.

$tf(p)=\sqrt{\sum_{w_i\in set(p)f(w_i)}}$

$nm(c)=1/\sqrt{|set(c)|}$

1.4query排序

为了找到与输入对匹配的response,需要对于生成的候选query进行排序.排序算法为random walk:

r^0=\alpha

r^{t+1}=(1-\lambda)\times T\times r^t+\lambda\times\alpha

式中,t没迭代次数,\alpha为初始向量.

计算输入p与candidate c的得分如下:

E(c)=score(p,c)*r(c)

安装E(c)值对所有candidate进行排序.

效果对比

这里写图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

imperfect00

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

[Meetings] Call for participation - IEEE ROBIO 2024

a18340879620的博客

07-05

2320

Dear colleagues,On behalf of the organizing committee, it is our pleasure to announce the 2024 IEEE International Conference on Robotics and Biomimetics (IEEE ROBIO 2024), which will take place from December 10 to 14 in Bangkok, Thailand https://ieee-robio

2024-12-11 AnolisOS 8.8 PostgreSQL 配置文件详解一

云端

11-16

981

2024-12-11 AnolisOS 8.8 PostgreSQL 配置文件详解一

参与评论您还未登录，请先登录后发表或查看评论

NTCIR-13 We Want Web 任务概述

weixin_30646505的博客

05-27

670

NTCIR-13 We Want Web 任务概述原文来源：http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings13/pdf/ntcir/01-NTCIR13-OV-WWW-LuoC.pdf摘要：本文给出了NTCIR We Want Web（WWW）任务的概述，该任务包括中文和英语子任务。WWW任务是一个经典的ad-hoc 文本检索任...

看人机对话技术一步步突破与发展

周红伟讲AI

07-23

8552

哈尔滨工业大学刘挺教授：历经50年，看人机对话技术一步步突破与发展！ | CCF-GAIR 本文作者：思颖 2017-07-21 09:09 导语：下一步，让机器分析你的言外之意雷锋网按：2017 年 7 月 8 日，由中国计算机学会（CCF）主办，雷锋网与香港中文大学（深圳）承办的全球人工智能与机器人峰会（CCF-

Microsoft COCO: Common Objects in Context - Test Guidelines

程永强

06-16

869

Microsoft COCO: Common Objects in Context - Test Guidelineshttp://cocodataset.org/#homehttp://cocodataset.org/#guidelinesHome -> Evaluate -> Test Guidelines Test GuidelinesThe COCO data can be o...

MLMs之GPT-4：《GPT-4 Technical Report》的翻译与解读

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

03-15

1万+

Paper：《GPT-4 Technical Report》的翻译与解读目录 Paper：《GPT-4 Technical Report》的翻译与解读 Abstract摘要 1、Introduction简介 2、Scope and Limitations of this Technical Report本技术报告的范围和局限 3、Predictable Scaling可预测的比例 4、Capabilities能力 5、Limitations局限性

解决app项目出现Are you interested in participation的问题

qq_45863690的博客

04-24

559

我们在yarn dev的时候出现 Are you interested in participation ? 解决方案：找到nuxt.config.js，添加telemetry: false，即可解决。 export default { telemetry: false, //解决Are you interested in participation弹出的问题 } ...

【comfyui工作流】利用 Flux 和 In- Context-LoRA 打造个人的专属四格漫画世界

最新发布

2401_84760527的博客

12-17

1243

==今天我们用阿里开源的技术，结合 FLUX 的强大出图能力，来打造 Lily 的专属四格漫画世界。这个 Cute 4koma LoRA 可以让我们快速生成精美的漫画图像，超级方便！首先，我们用来编写提示词，它能根据我们设定的角色和内容严格生成相关的提示词。以一个虚拟的动漫人物Lily为例，变换不同的场景，以六个不同的故事设定提纲让kimi生成的内容的提示词，再粘贴给ComfyUI工作流完成四格漫画的生成。工作流使用常用的Flux文生图工作流即可，如下图所示。

Nuxt项目启动时Are you interested in participation设置如何修改

a7442358的专栏

05-06

5030

Nuxt项目启动时Are you interested in participation设置如何修改

112-Participation-of-an-Energy-Hub-in-Electricity-and matlab.rar

10-09

Participation of an Energy Hub in Electricity and Heat Distribution Markets: An MPEC Approach Introduction This repository is related to our research on the market participation of the energy hub in ...

基于matlab实现Participation-of-an-Energy-Hub-in-Electricity

04-14

本项目"基于matlab实现Participation_of_an_Energy_Hub_in_Electricity_and_Heat_Distribution_Markets"旨在探讨能源枢纽如何参与电力和热能分配市场的模拟和优化。下面我们将详细讨论相关的MATLAB实现和知识点。 1...

java图形拼接源码-Participation-years-in-GSoC:一个Python脚本，可以抓取Google的SummerofCo

06-05

12 12 12 12 11 11 11 10 10 10 10 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3...

RED: DCU-CASICT Participation in WMT2014 Metrics Task

02-21

In this paper, we propose a novel evaluation metric based on dependency parsing model, which does not need this human involvement. Experimental results show that the new single metric gets better ...

参与奖杯「Participation Trophies」-crx插件

03-13

用“参与奖杯”代替“同盟雕像”。将文字“同盟雕像”替换为“参与奖杯”。支持语言:English (United States)

snownlp文本情感分析使用

热门推荐

u011961856的专栏

01-16

2万+

snownlp为python版的文本分析工具，ubuntu安装snownlp命令为：pip install snownlp。利用snownlp可以进行分词、词性标注、文本摘要提取、文本情感分析等，下面贴出snownlp分词、词性标注、情感分析代码如下： from snownlp import SnowNLP s = SnowNLP(u'这个东西真心很赞') key=s.words # [

sentencePiece 分词原理学习

u011961856的专栏

08-14

9794

sentencePiece分词原理学习

清华大学thulac分词和词性标注代码理解

u011961856的专栏

01-15

9486

清华大学的thulac中分分词词法包，包含有中文分词和词性标注，从测试精度和速度看，效果还不错，github上有提供c++和python代码，c++代码包含有训练和测试代码，python代码只有测试代码，速度也较慢，github地址为：https://github.com/thunlp/THULAC。根据github上提出的参考文献，完全无法看懂代码和文章有什么关系，代码也比较难以理

QRNN(Quasi-Recurrent Neural Networks)

u011961856的专栏

08-20

8967

keras代码:https://github.com/DingKe/qrnn模型结构如下: qrnn第一层为卷积层,用于提取输入特征,第二层为pooling层,用于减少特征数目,但语常用的pooling层不同的是,qrnn采用fo-pool方法,具体计算如下.卷积层:对于输入X,分别通过三个卷积层和非线性层得到Z,F,O,公式如下:Z=tanh(Wz∗X)Z=tanh(W_z*X)F=σ(Wf∗X

忽略‘50unattended-upgrades.ucf-dist’(于目录‘/etc/apt/apt.conf.d/’)，鉴于它的文件扩展名无效

u011961856的专栏

07-25

5762

ubuntu 安装opencv的时候,终端运行命令: sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev 出现错误: 错误:1 http://cn.archive.ubuntu.com