- 博客(13)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 Kubeadm v1.28 国内 kubeadm init 失败的问题
部署kubeadm 1.28版本时,遇到以下问题,处理containerd,换源等方法都不行,最后发现是containerd配置文件中的源有问题。接着编辑/etc/containerd/config.toml文件,把。
2024-02-13 23:26:32 1030 1
原创 ubuntu下域名解析出问题的解决办法
内网服务器配置了固定ip,未配置dns,临时需要接入外网时,域名解析失败,需要临时添加域名解析操作如下:sudo vim /etc/resolv.conf然后底下插入你的好用的dns,比如8.8.8.8最后保存退出,重启网络服务即可service network-manager restart此方法重启后将失效,适用于临时开放外网操作...
2019-12-10 10:34:42 1551
原创 PPO、GAE笔记
一、 重要性采样TRPO和PPO主要思想的数学基础是重要性采样重要性采样:$x_i $ 是从p(x)p(x)p(x)分布中采样得到的, 但是p(x)p(x)p(x)的值往往无法直接获得,需要通过其他分布q(x)q(x)q(x)进行间接采样获得。Ex∼p[f(x)]=∫f(x)p(x)dx=∫f(x)p(x)q(x)q(x)dx=Ex∼q[f(x)p(x)q(x)]\begin{alig...
2019-03-06 21:35:23 12456 6
转载 强化学习专题笔记(一) 强化学习基础
转自 我的博客一、长期回报对于问题的简化,采用理想的MDP,简化问题到具有马尔科夫性,对于马尔科夫决策过程而言,在理想状态下,每一个行动都要为最终的目标最大化长期回报 而努力。max∑trt\max\sum_{t}{r_t}maxt∑rt但是很多情况下,仿真的时间维度较大,步数较多,甚至可以无限循环下去,这样的情况下我们需要引入一个可以和收敛的无穷数列,来替代我们最原始的长期...
2019-02-19 23:27:57 500
原创 [强化学习论文] (HDQN) Integrating Temporal Abstraction and Intrinsic Motivation
转自我的博客论文题目: Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation作者: Tejas D. Kulkarni, Karthik R. Narasimhan, Ardavan Saeedi, Joshua B. Tenenbau...
2019-02-19 23:26:17 1679 3
原创 [强化学习笔记专题(二)]Nature DQN
转自 我的博客DQN (Nature)一、 算法流程:定义可配置参数episode 数量 M最大仿真时间 T,ϵ−greedy\epsilon-greedyϵ−greedy参数ϵlow\epsilon_{low}ϵlow,ϵhigh\epsilon_{high}ϵhighbatch size NNN折扣率 γ\gammaγ,学习率 α\alphaα等优化器参数...
2019-02-19 23:24:15 2075
原创 MPC控制笔记(一)
转自 我的博客笔记参考1:Understanding Model Predictive Control(Youtube 带自动生成字幕)笔记参考2:Understanding Model Predictive Control(B站 生肉)一、什么是MPC模型预测控制MPC(Model Predict Control)是一种反馈控制(feedback control)算法, 使用模型来预...
2019-02-19 23:22:17 48862 3
原创 Git clone wiringPi出现Connection reset by peer的解决办法
Git clone wiringPi出现Connection reset by peer的解决办法
2016-02-22 22:46:59 6825
原创 Visual Studio Code 文本编辑功能初体验
Visual Studio Code官方地址 :https://code.visualstudio.com/ 昨晚跟build大会跟到1点40就睡着了,不过build大会介绍发布visual studio code的片段还是深深吸引了我,跨平台,轻量级,连git,只是算不上ide,编辑和操作像sublime~~ctrl shift p,界面像atom
2015-04-30 21:48:12 1782
unity3D 写socket 服务器
2014-12-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人