自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 【小蓝书系列】K近邻法(KNN)

k近邻法(KNN)是无显式学习

2020-04-18 16:16:20 31 0

原创 【小蓝书系列】感知机

  我们经常能在许多模型中看到MLP,那么MLP是什么呢?其实MLP就是多层感知机(Multi-Layer Perceptron),下面我们来跟随小蓝书介绍下感知机。

2020-04-13 18:03:38 12 0

原创 【小蓝书系列】统计学习方法概论

1.1 统计学习   首先要知道何为统计学习,蓝皮书给出的定义是: 统计学习(statistical learning) 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科,又称统计机器学习。笼统地来说,统计学习的研究对象是数据,目的是对数据进行预测和分析。 1.1.1 ...

2020-04-04 00:56:04 23 0

原创 【Debug】关于往列表中添加字典元素出现的问题

敲代码日常犯下愚蠢错误系列。。大致就是写了个循环把字典当成元素append进列表后发现:每次append进列表一个临时字典的时候,之前添加进去的也会被覆盖,举例如下: result = {'train':[]} temp_item = {} temp_list = [] fal...

2019-12-07 16:33:57 28 0

原创 【学习笔记】传说中的马尔可夫决策过程(MDP)和贝尔曼方程(Bellman Equation)

最近读了几篇paper,都着重涉及到了强化学习,都点到了马尔科夫决策过程(Markov decision process)和贝尔曼方程或者叫贝尔曼等式(Bellman equation),捧着似懂非懂的脑袋,决定这里把它们一网打尽。 1 马尔可夫决策过程(MDP) 马尔可夫决策过程主要是用来描述...

2019-12-05 15:38:28 399 0

原创 【论文笔记】dialog system related with keywords: hierarchical reinforcement learning, context-aware, EVPI

本周论文目录 [1]Context-Aware Symptom Checking for Disease Diagnosis Using Hierarchical Reinforcement Learning [2]Learning to Ask Good Questions: Ranking C...

2019-11-28 11:02:14 72 0

原创 【学习笔记】强化学习中的Q-Learning

写在前面 本文内容参考莫凡大神的强化学习教程: 莫凡大神RL教程 Q-Learning的思想 当今社会每个人有自己的做事方式,有些人做事是不顾后果先做了再说,而且从来不吸取教训,比如HK废青;而有些人就不一样了,做事前会拟定策略(policy),并且根据采取不同策略产生的后果(reward or...

2019-11-21 09:10:57 30 0

原创 【论文笔记】End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

Proposed Method 文章提出的端到端的知识路由关系对话系统(KR-DS)是一个任务型对话系统,依然包括老三样:==NLU, DM和NLG。==其中: NLU是用来从对话中辨别用户的意图和槽位值(slot指槽位,及约束条件) 。 DM则是根据当前的对话状态(current di...

2019-11-04 20:22:02 166 0

提示
确定要删除当前文章?
取消 删除