自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

PoleToWin的博客

SHU学生

  • 博客(21)
  • 收藏
  • 关注

原创 NLP(4) 语言模型

倒排表QA system 中 返回相似度最高的答案,对于知识库,需要计算N次相似度,O(N) 每次相似度计算的复杂度,无法满足实时性要求解决问题核心思想“层次过滤思想”遇到问题,O 输入,和所有问题匹配,10^6 多次过滤 -> 10 ^3 -> 10 ^2;最后通过余弦相似度比较最后5个…核心思想 过滤依次选取时间复杂度最快的,即过滤器1时间复杂度1>>过滤器...

2020-01-26 19:10:32 152

原创 Python 并行编程

execvp开启一个新的进程,替换当前的进程,当前进程不再运行execl(file, arg0,arg1,…) 用参数列表arg0, arg1 等等执行文件execlp(cmd, arg0,arg1,…) 于execl()相同,但是在用户的搜索路径下搜索完全的文件路径名execvp(cmd, arglist) 除了带有参数向量列表,与execlp()相同os.execl("/usr/bin...

2019-10-14 17:17:38 219

原创 NLP(3)词向量

Measure similarity between wordsOne-hot 和预先相似度无法表示相似Another Issue: Sparsity我们 今天 打算 去 爬山过去的方法 向量的大小和词典大小相同但是大部分全是0,只有少数不是0,可能只有小于100个非0,10^5 都是0问题:不能表示语义相似度稀疏性Distributed Representation向量长度认...

2019-09-29 10:41:09 281

原创 NLP(2)问答系统intro

基于搜索的问答系统Question从知识库中寻找相似度最高的问题,返回对应问题的答案对于问题,首先进行分词,然后预处理:1)拼写检查2)寻找单词原型3)stop words4)words filter5)同义词然后文本的表示,将文本转换成向量的形式,结构化的数据,数学中的公式,文本方式:0,1,1,… Boolean vectorconst vectortf-if 形式w...

2019-09-28 21:48:46 546

原创 NLP(1) intro

introductionNLP=NLU+NLGU understanding G generationwhy nlp is harder than computer vision?CV 所见即所得文本->meaningchallenge: multiple ways to express the same meaningambiguity 一词多义(1)how to sol...

2019-09-24 21:22:40 135

原创 Introduction to Computational Applied Statistics

matplotlibplt.plot(xvals, np.sin(xvals), label = r"$y = \sin(x)$",color='red',marker='o')plt.plot(xvals, np.cos(xvals), label = r"$y = \cos(x)$",color='g',linestyle='--')plt.legend(loc= 'upper righ...

2019-08-02 09:37:27 172

原创 Introduction to Computational Applied Statistics

This course is provided from Mcgill University summer short program, Machine Learning program.This is my own lecture notes.Consider the two distributions in the figure just below. Within each grap...

2019-08-02 09:37:14 167

原创 Vue(2)

开始练习品牌案例 品牌列表的添加和删除<!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><title></title><script src="https://cdn.jsdelivr.net/npm/vue/dist/vue.js"&gt...

2019-07-24 23:30:46 94

原创 强化学习(7)

强化学习(7)策略梯度学习强化学习另外一个分支基于环境是否已知,基于策略来分有on、off policy1.策略梯度思想2.Reinforce算法使用基于值函数的学习需要和环境交互,传统普通的 基于Q表,通过对应的target更新方式,采用绝对贪婪策略确定策略。与环境交互得到值函数,输入神经网络再取到Q值比较大的地方,传统的Q-learning和DQN都是通过最优值函数...

2019-07-10 21:25:22 257

原创 强化学习(6)

RL->DRL深度Q网络1、值函数的近似:对Q表近似2、Deep Q network为什么要把深度学习引入强化学习?自身处于研究的角度,遇到什么问题?在Q-learning中,首先初始化一个Q表,然后通过agent与环境交互采样获得episodes,最后根据Q值迭代直到收敛,得到最优的Q表对于4*4的矩阵 处理是简单的;但如果对于超级玛莉 显然有无数种,因为是连续的,很难列出所...

2019-07-02 00:06:40 711

原创 强化学习(5)

深度理解强化学习强化学习解法 Q-learning时序差分学习on-policy : 在估计policy和值函数的时候,生成的样本所采用的policy与估计时用的一样的policy 同一策略下确定off-policy 估计policy和值函数时候 生成样本episode所采用的policy与估计时用的是不一样的policyon-policy 一边探索一边学习策略off-policy 两...

2019-06-30 11:07:27 348

原创 强化学习(4)

强化学习解法1)MDP模型求解,动态规划2)蒙特卡罗学习 采样 根据Q值学习3)持续差分算法TD算法内容:1)时序差分学习(Temporal-Difference Learning)2)Sarsa算法3)总结学过的RL解法DP:model-based 学习方式 需要知道状态转移矩阵;直接计算所有状态动作pair 的Q值或者V值表,然后通过贪心策略获得agent 的策略Monte...

2019-06-30 00:30:31 221

原创 强化学习(3)

建模成马尔可夫决策过程,动态规划方法,一般或者最优策略,对状态转移概率清楚,遍历并选择策略,评价策略好坏,更新策略现实中无法知道环境,不知道状态,不知道概率,对于这类序列决策问题蒙特卡洛学习 Monte-Carlo Prediction目标:Agent Environment寻找最优策略 使得期望Q(S,W)最大化动态规划知道所有环境,我们需要知道环境的一个近似,MC方法从episode...

2019-06-29 11:30:25 278

原创 Vue学习(1)

Vue使用微软的vscode 学习相关代码使用open in browser 插件 alt+b 在浏览器使用<!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><title></title><script src="https://cdn....

2019-06-15 18:54:21 157

原创 强化学习(2)

基于序列决策过程基础上马尔克夫决策过程1.强化学习模型构建具体优化什么变量?state 参数更新时和环境交互环境给Agent一个观察,智能体给一个动作,环境给一个reward 再下一个观察…数学化environment将state s0传递给agent,然后action A0,reward R1即S0 A0 R1 S1 A1…对这些序列 即Episode 学习每一次的过程称为Ep...

2019-06-08 21:54:31 649

原创 强化学习(1)

强化学习第一讲传统机器学习——有监督学习——回归任务、分类任务无监督学习——无标签——K-means——超像素分割Superpixel,根据色差 像素 等差异性 进行分类传统机器学习不能做什么?实现机器人的特殊舞步AlaphaGo强化学习一般性的框架 学习序列决策任务decision making tasks强化学习还能做什么?管理、控制集群的资源管理智慧城...

2019-06-08 19:58:43 307

原创 Go语言学习笔记(5)

cookiepackage mainimport ( "html/template" "net/http")func welcome(w http.ResponseWriter, r *http.Request){ t,_:=template.ParseFiles("view/index.html") t.Execute(w,nil)}func setCookie(w h...

2019-05-08 22:08:24 109

原创 Go语言学习笔记(4)

Go语言学习笔记(4)文件下载package mainimport ( "fmt" "html/template" "io/ioutil" "net/http")func download(w http.ResponseWriter, r *http.Request){ filename:=r.FormValue("filename") f,err:=ioutil.Rea...

2019-05-05 20:40:34 147

原创 Go语言学习笔记(3)

Go语言学习笔记(3)actioneq 等于ne 不等于lt 小于 (less than)le 小于等于gt 大于ge 大于等于if else 部分package mainimport ( "html/template" "net/http")func welcome(w http.ResponseWriter, r *http.Request){ t,_:=te...

2019-05-04 16:50:00 142

原创 Go语言学习笔记(2)

go语言学习笔记这是go语言web项目的标准结构引入静态资源package mainimport ( "html/template" "net/http")func welcome(w http.ResponseWriter, r *http.Request){ t,_:=template.ParseFiles("view/index.html") t.Execute(w...

2019-05-03 23:57:44 179

原创 Go语言学习笔记(1)

Go语言学习笔记由于目前是学生身份,所以使用的是JetBrains全家桶系列,Goland这是多处理器多Handler方式package mainimport ( "fmt" "net/http" "strings")//多处理器多Handlertype MyHandler struct {}func(m *MyHandler) ServeHTTP(w http...

2019-05-03 21:38:34 196

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除