
人工智能和深度学习
文章平均质量分 66
hwang4_12
专注于自然语言处理相关的研究,从事的工作是智能客服相关的工作,有文本生成、对话系统、问答系统、文本相似度相关研究经验
展开
-
李宏毅强化学习学习笔记-policy gradient and PPO
1、强化学习policy gradient中,为什么需要将reward减去一个baseline? 策略梯度在进行优化的时候,使用的都是对数据进行采样,当所有的奖励都是正的时候,会对所有的梯度方向都鼓励,但是是进行归一化的,所以对那些奖励较少的方向,起到了抑制的效果。但是由于采样操作,当高奖励的动作没有sample到的时候,那些低奖励的动作就被鼓励执行了。 ...原创 2019-03-10 17:18:06 · 910 阅读 · 0 评论 -
问答系统
1、QA System KB-QA text-QA : 结合知识图谱作问答或者使用的是收集来的文本集合作问答 2、KB-QA 结构化数据 KB-QA is performed in two steps: (1) semantic parsing (语义分析)translates a question into a KB query, then (2) KBR (reasoning)trav...原创 2018-11-13 20:22:12 · 1015 阅读 · 0 评论 -
闲聊式对话系统
chitbot 直接使用数据训练一个端对端模型 1、lstm模型 2、HRED 模型 用来处理端对端模型里面的多轮对话,可以将context内容包括进去,然后也将utterance进行表示 3、attention 模型 pointer network chanllenges: a、回复单一的问题 最大相互信息熵损失函数、对抗网络、引入变分结构(VHRED模型)、利用检索...原创 2018-11-13 19:46:30 · 782 阅读 · 0 评论 -
任务型对话系统
1、 整个对话系统的流程: a、 开放域多轮对话,瞎聊,识别用户意图 b、 准入条件,根据设定好的准入条件,进入封闭域对话 c、 封闭域对话,填槽,必填槽不完整就要澄清让用户填完整,最终执行 解释: 从一个开放域转入到封闭域,或者从一个封闭域转入到另一个封闭域,中间的跳转是需要逻辑判断的,而这个逻辑判断就是准入条件。 2、封闭式对话 --- 具体...原创 2018-11-12 19:59:44 · 3460 阅读 · 0 评论 -
tensorflow 实现基本AutoEncoder,降噪自编码器
这篇博客主要是自己看了一些关于自编码器的文章和阅读了tensorflow自己公布的源码,并在源码上附上一些注释,因为要完全理解一个算法或者结构,最直接的方式就是阅读相关的源码。原创 2017-03-17 16:19:59 · 6017 阅读 · 2 评论