- 博客(10)
- 收藏
- 关注
原创 【论文笔记】Simplifying Task-oriented Dialogue Systems with Single Sequence-to-sequence Architectures
这篇文章提出了一个基于sequence-to-sequence(seq2seq)模型的方法用于对话状态跟踪(dialogue state tracking/belief tracking),该方法可同时解决对话任务以及生成系统的回复。
2020-09-27 20:59:10 474
原创 为什么样本的方差和样本的二阶中心矩并不一样
问题引入:很多同学会很奇怪一个问题,那就是为什么样本的二阶中心矩m2=1n∑i=1n(Xi−X‾)2m_2=\frac{1}{n} \sum_{i = 1}^{n}(X_i - \overline{X})^2m2=n1∑i=1n(Xi−X)2和样本的方差S2=1n−1∑i=1n(Xi−X‾)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i - \overline{X})^2S2=n−11∑i=1n(Xi−X)2相差一个常数因子n−1n\frac{n-1}{n}n
2020-09-18 17:48:56 15608 5
原创 【小蓝书系列】感知机
我们经常能在许多模型中看到MLP,那么MLP是什么呢?其实MLP就是多层感知机(Multi-Layer Perceptron),下面我们来跟随小蓝书介绍下感知机。
2020-04-13 18:03:38 302
原创 【小蓝书系列】统计学习方法概论
1.1 统计学习 首先要知道何为统计学习,蓝皮书给出的定义是:统计学习(statistical learning) 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科,又称统计机器学习。笼统地来说,统计学习的研究对象是数据,目的是对数据进行预测和分析。1.1.1 统计学习的对象 上面有说到统计学习的对象是数据,即从数据出发,提取特征,抽象出模型。而数据本身是...
2020-04-04 00:56:04 460
原创 【Debug】关于往列表中添加字典元素出现的问题
敲代码日常犯下愚蠢错误系列。。大致就是写了个循环把字典当成元素append进列表后发现:每次append进列表一个临时字典的时候,之前添加进去的也会被覆盖,举例如下:result = {'train':[]}temp_item = {}temp_list = []false_sym = {}casual = []temp_list = ['咳嗽', '发烧', '头晕']for...
2019-12-07 16:33:57 383
原创 【学习笔记】传说中的马尔可夫决策过程(MDP)和贝尔曼方程(Bellman Equation)
最近读了几篇paper,都着重涉及到了强化学习,都点到了马尔科夫决策过程(Markov decision process)和贝尔曼方程或者叫贝尔曼等式(Bellman equation),捧着似懂非懂的脑袋,决定这里把它们一网打尽。1 马尔可夫决策过程(MDP)马尔可夫决策过程主要是用来描述强化学习任务的,强化学习与我们所熟知的监督学习不一样,监督学习中每个样本都以一个label,从而通过...
2019-12-05 15:38:28 2755
原创 【论文笔记】dialog system related with keywords: hierarchical reinforcement learning, context-aware, EVPI
本周论文目录[1]Context-Aware Symptom Checking for Disease Diagnosis Using Hierarchical Reinforcement Learning[2]Learning to Ask Good Questions: Ranking Clarification Questions using Neural Expected Value...
2019-11-28 11:02:14 326
原创 【学习笔记】强化学习中的Q-Learning
写在前面本文内容参考莫凡大神的强化学习教程:莫凡大神RL教程Q-Learning的思想当今社会每个人有自己的做事方式,有些人做事是不顾后果先做了再说,而且从来不吸取教训,比如HK废青;而有些人就不一样了,做事前会拟定策略(policy),并且根据采取不同策略产生的后果(reward or penalty) 来更新自己的计划表,当然这里的后果在每一次更新自己的计划表前并没有实践,而是靠想...
2019-11-21 09:10:57 264
原创 【论文笔记】End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis
Proposed Method文章提出的端到端的知识路由关系对话系统(KR-DS)是一个任务型对话系统,依然包括老三样:==NLU, DM和NLG。==其中:NLU是用来从对话中辨别用户的意图和槽位值(slot指槽位,及约束条件) 。DM则是根据当前的对话状态(current dialogue state)进行主题切换,DM中的代理(agent)会学着去向用户询问症状瞅瞅究竟是何种疾病,从...
2019-11-04 20:22:02 1557 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人