自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 Kubedge keadm init 出现Error: context deadline exceeded

执行init时。

2024-04-10 00:41:42 406 1

原创 coredns 状态为running但not ready

解决方法,直接delete coredns,自己会重启。

2024-02-16 09:58:10 509 1

原创 Kubeadm v1.28 国内 kubeadm init 失败的问题

部署kubeadm 1.28版本时,遇到以下问题,处理containerd,换源等方法都不行,最后发现是containerd配置文件中的源有问题。接着编辑/etc/containerd/config.toml文件,把。

2024-02-13 23:26:32 838 1

原创 ubuntu下域名解析出问题的解决办法

内网服务器配置了固定ip,未配置dns,临时需要接入外网时,域名解析失败,需要临时添加域名解析操作如下:sudo vim /etc/resolv.conf然后底下插入你的好用的dns,比如8.8.8.8最后保存退出,重启网络服务即可service network-manager restart此方法重启后将失效,适用于临时开放外网操作...

2019-12-10 10:34:42 1500

原创 PPO、GAE笔记

一、 重要性采样TRPO和PPO主要思想的数学基础是重要性采样重要性采样:$x_i $ 是从p(x)p(x)p(x)分布中采样得到的, 但是p(x)p(x)p(x)的值往往无法直接获得,需要通过其他分布q(x)q(x)q(x)进行间接采样获得。Ex∼p[f(x)]=∫f(x)p(x)dx=∫f(x)p(x)q(x)q(x)dx=Ex∼q[f(x)p(x)q(x)]\begin{alig...

2019-03-06 21:35:23 11803 6

转载 强化学习专题笔记(一) 强化学习基础

转自 我的博客一、长期回报对于问题的简化,采用理想的MDP,简化问题到具有马尔科夫性,对于马尔科夫决策过程而言,在理想状态下,每一个行动都要为最终的目标最大化长期回报 而努力。max⁡∑trt\max\sum_{t}{r_t}maxt∑​rt​但是很多情况下,仿真的时间维度较大,步数较多,甚至可以无限循环下去,这样的情况下我们需要引入一个可以和收敛的无穷数列,来替代我们最原始的长期...

2019-02-19 23:27:57 471

原创 [强化学习论文] (HDQN) Integrating Temporal Abstraction and Intrinsic Motivation

转自我的博客论文题目: Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation作者: Tejas D. Kulkarni, Karthik R. Narasimhan, Ardavan Saeedi, Joshua B. Tenenbau...

2019-02-19 23:26:17 1598 3

原创 [强化学习笔记专题(二)]Nature DQN

转自 我的博客DQN (Nature)一、 算法流程:定义可配置参数episode 数量 M最大仿真时间 T,ϵ−greedy\epsilon-greedyϵ−greedy参数ϵlow\epsilon_{low}ϵlow​,ϵhigh\epsilon_{high}ϵhigh​batch size N​N​N​折扣率 γ\gammaγ,学习率 α\alphaα等优化器参数...

2019-02-19 23:24:15 2042

原创 MPC控制笔记(一)

转自 我的博客笔记参考1:Understanding Model Predictive Control(Youtube 带自动生成字幕)笔记参考2:Understanding Model Predictive Control(B站 生肉)一、什么是MPC模型预测控制MPC(Model Predict Control)是一种反馈控制(feedback control)算法, 使用模型来预...

2019-02-19 23:22:17 48444 3

原创 Linux内存占用过高?非也

Linux内存占用过高

2016-03-08 00:09:43 7331 1

原创 Git clone wiringPi出现Connection reset by peer的解决办法

Git clone wiringPi出现Connection reset by peer的解决办法

2016-02-22 22:46:59 6765

原创 VS2013 API方法连接 64位 MySQL56

学习使用vs2013进行mfc连接mysql56

2015-07-25 12:08:08 587

原创 Visual Studio Code 文本编辑功能初体验

Visual Studio Code官方地址 :https://code.visualstudio.com/ 昨晚跟build大会跟到1点40就睡着了,不过build大会介绍发布visual studio code的片段还是深深吸引了我,跨平台,轻量级,连git,只是算不上ide,编辑和操作像sublime~~ctrl shift p,界面像atom

2015-04-30 21:48:12 1732

PS 教学PPT 第二期

office2013打开,科协为了给部员讲课做的,反响不错,内容有限,模板还是很炫的,欢迎一试~~

2015-03-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除