- 博客(8)
- 资源 (8)
- 收藏
- 关注
原创 Tencent_AILab_ChineseEmbedding.txt使用
正在做问答系统,看到腾讯正式开源一个大规模、高质量的中文词向量数据集Tencent_AILab_ChineseEmbedding.txt,简直喜极而泣。下载地址:https://ai.tencent.com/ailab/nlp/embedding.html ,里边有对数据集的介绍还有论文的下载地址。迅速写了一个代码,用在我自己的问答系统中,效果嘛还在训练,初始几步的loss确实比之前随机初始化下...
2018-10-19 16:21:20 7594 10
原创 A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings论文笔记
回看前几篇笔记发现我剪贴的公式显示很乱,虽然编辑时调整过了,但是不知道为什么显示的和编辑时的不一样,为方便大家的阅读,我开始尝试着采用markdown的形式写笔记,前几篇有时间的话再修改。这篇论文阅读完,我依然有很多不懂的地方,对其操作不是很清晰,因为我没做过这方面的内容,且近期估计没时间学习其项目,所以记录理解的可能有误,希望大家带着思考阅读。PS:感觉这篇文章的作者是这个方向的大神呢,引...
2018-10-16 11:39:29 1263 1
转载 记忆网络Memory Network
今天看的文章主要涉及记忆网络,其他并无新意,所以就懒得自己写了,直接转载容易理解的博文。作者:北邮张博 来源:CSDN 原文:https://blog.csdn.net/irving_zhang/article/details/79094416?utm_source=copy 在本专栏的第一篇文章对话系统综述中提到,seq2seq中的记忆依靠rnnCell或者lstmCell实现,但是...
2018-10-15 11:41:29 1050
原创 Gated Self-Matching Networks for Reading Comprehension and Question Answering论文笔记
原文下载链接摘要检索式问答系统试图从文档中获取问题的答案。一般步骤是先从一众文档中检索相关文档,然后再进一步检索文档回答问题。本文解决的是后一步,即阅读理解式的问答系统。文章基于端到端的多层神经网络模型从篇章中获取答案。模型分为四部分:一是使用多层双向神经网络编码问题和篇章的语义向量表示;二是使用门注意力机制得到问题感知的篇章的语义向量表示;三是通过 Self-Matching 注意力...
2018-10-12 15:07:18 924
原创 Discriminative Information Retrieval for Question Answering Sentence Selection论文笔记
原文下载地址摘要该算法提出场景:text-based QA,即给定一段文字说明,提出问题,从文字说明中找出相应答案作答。text-based QA算法的主要步骤包含三个:1)获取可能包含答案的段落;2)候选段落的重排;3)提取信息选择答案本文的算法主要是解决第一个步骤算法算法主要框架: 预处理:将文字说明切成一...
2018-10-11 09:42:34 324
原创 Question Retrieval with Distributed Representations and Participant Reputation in Community QA论文笔记
原文下载地址摘要社区问题的难点在于:重复性问题 解决上述问题要采用Query retrieval(QR),QR的难点在于:同义词汇 本文算法:1)采用continuous bag-of-words(CBoW)模型对词(word)进行 Distributed Representations(分布式表达,词嵌入);2)对given query和存档的query计算tile域和descrip...
2018-10-10 10:17:35 340
原创 Lingke: A Fine-grained Multi-turn Chatbot for Customer Service
最近做问答系统领域,要求自己每天读一篇论文,为帮助自己理解和记忆,将要点记录在博客上 摘要机器人类型:信息检索型机器人(给一段资料回答问题) 特色功能:1)基于给定的产品说明书回答问题;2)能够应对多轮对话方案流程 ...
2018-10-10 08:51:42 418
转载 对话语料库
用于训练中英文对话系统的语料库 Datasets for Training Chatbot System用于对话系统的中英文语料 本项目收集了一些从网络中找到的用于训练中文(英文)聊天机器人的对话语料 公开语料搜集到的一些数据集如下,点击链接可以进入原始地址dgk_shooter_min.conv.zip 中文电影对白语料,噪音比较大,许多对白问答关系没有对应好The NUS S...
2018-10-09 09:39:55 1425
tensorflow-1.1.0rc2-cp35-cp35m-win_amd64.whl
2017-08-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人