机器阅读理解
关于机器阅读理解的文章
青萍之默
踏实好学
展开
-
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(十)—— 模型前向计算数据流动
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(五)—— 准备数据菜鸟笔记-D...原创 2020-03-28 23:37:59 · 702 阅读 · 2 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(九)—— 预测与校验
系列目录:1. [菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据](https://blog.csdn.net/wmq104/article/details/104218865) 2. [菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)—— 介绍及分词](https://blog.csdn.net/wmq104/article/details/104...原创 2020-03-28 10:29:48 · 793 阅读 · 2 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(八)—— 模型训练-训练
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(五)—— 准备数据菜鸟笔记-D...原创 2020-03-27 22:55:30 · 825 阅读 · 0 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(七)—— 模型训练-数据准备
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(五)—— 准备数据菜鸟笔记-D...原创 2020-03-27 15:42:57 · 819 阅读 · 0 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(六)—— 模型构建
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(五)—— 准备数据未完待续 ...原创 2020-02-23 20:43:54 · 1346 阅读 · 4 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(五)—— 准备数据
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取未完待续 … …准备数据包括检查数据、创建文件夹、准备词典、准备词嵌入。具体实现见...原创 2020-02-10 23:44:56 · 801 阅读 · 3 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(四)—— 段落抽取
系列目录:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)——数据菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)——介绍及分词菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理未完待续 … …基线系统加入了新的段落抽取策略来提升模型表现。段落抽取思路基线系统使用了新的段落抽取策略提高模型效果,具体代码见DuReader代码库中p...原创 2020-02-10 14:05:44 · 1074 阅读 · 0 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(三)—— 预处理
DuReader数据集为每个用户问题提供了大量的文档,对于常见的RC模型这些文档太长。基线系统中对于训练集和校验集选择了与答案最相关的段落,在推理时,选择与问题最相关的段落推理。另外,由于基线系统选用的模型是抽取型模型,也就是需要从原文中寻找答案的模型,所以预处理代码选取了F1值最大的答案、段落词块对作为为答案用于训练,处理策略在utils/preprocess.py中实现。选取最相关段落对每...原创 2020-02-09 20:23:17 · 1402 阅读 · 8 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(二)—— 介绍及分词
数据部分请见上一篇文章:菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)—— 数据官方基于了DuReader给了两个基线模型:(BiDAF 和 Match-LSTM):Match-LSTM是广泛应用的MRC模型,Match-LSTM为了在文章中找到答案,依次遍历文章,动态地将注意力权重与文章的每个标记进行匹配。最后,使用一个应答指针层来查找文章中的答案跨度。BiDAF既...原创 2020-02-08 17:51:55 · 1448 阅读 · 8 评论 -
菜鸟笔记-DuReader阅读理解基线模型代码阅读笔记(一)—— 数据
机器阅读理解是可以让计算机读取、处理、理解自然语言文本,这是人工智能的核心能力之一。在下一代搜索引擎和智能客服产品中具有重要价值。百度在2017年发布了大规模的中文MRC数据集:DuReader。DuReader的特点它是一个新的大型开放中文机器阅读理解数据集,其在中文应用中还是很有开创意义。相比以前的MRC数据集,DuReader有以下特点:所有的问题、原文都来源于实际数据(百度搜索引擎...原创 2020-02-08 10:42:51 · 2414 阅读 · 5 评论