自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (5)
  • 收藏
  • 关注

原创 pyscipopt安装错误

更换cython版本为0.29.37, 博主scip版本7.0.3 python3.7。

2024-08-20 15:01:53 106

原创 Generative Adversarial Imitation Learning(Gail) 论文阅读

原版:对于agent做出的动作a,r(s, a) = − log(1 − D(s, a)) ,被判别器判定越接近专家行为,奖励就越大,这种方式适用于有生存奖励的RL环境,比如说Atari游戏,但对于想尽快结束的环境可能不适合,如果用这种方式也需要结合环境原本奖励并把Gail奖励的系数调低。相较于PPO 其需要一个额外的判别器D,D的作用是用来区分agent做出的动作和expert做出的动作,越接近于expert的动作 D的输出越接近1.Gail是一种使用PPO更新方法的模仿学习,

2024-08-14 21:37:40 322

原创 MC方法与TD方法区别

因为其更新是使用G来更新, G是一个真实从环境的值,需要获得完整的episode之后才计算得到,但获取这一条episode本身是一个概率较小的事件,所以这是一个高方差的更新,如果G是当前状态下获取之后所有奖励的期望,那么这个公式就是偏差和方差都为0的更新,但获取G的期望是一个很难的事情,需要遍历从当前状态所有episode的可能。其中G为当前状态到episode截止所有reward之和,Q-learning base 的方法经常使用MC方法来进行更新。上面是TD(0)的更新,TD(n)等同于MC的方法。

2024-08-14 21:36:40 251

原创 VS code justmycode = false 无效

VS code justmycode = false 无效1.90版本VScode 有bugg,暂时退回1.89版本可用https://code.visualstudio.com/updates/v1_89

2024-06-11 11:49:38 138

原创 “from torch._C import * ImportError: DLL load failed: 找不到指定的程序”

from torch._C import * ImportError: DLL load failed: 找不到指定的程序” , python版本从3.6.0–>>3.6.5解决问题。

2023-11-27 22:17:53 134 1

原创 虚拟环境找不到包,“ImportError: cannot import name ‘XXX‘”

这个运行配置里面也可以选择虚拟环境,结果就是 你运行的代码是基于这个运行配置里的虚拟环境 而不是你项目设置里的虚拟环境,所以明明装了包,pip list也可以看到,甚至写代码 import 也不会报错,但代码已运行就会报错。

2023-11-23 22:16:47 265

原创 SummaryWriter 打不开log问题

summarywriter 打不开log问题

2023-05-16 13:06:24 447

原创 Tensorboard 奇怪错误 解决 ‘utf-8‘ codec can‘t decode byte 0xd6

Tensorboard 奇怪错误 解决 ‘utf-8‘ codec can‘t decode byte 0xd6。

2023-04-24 16:25:24 553 3

原创 未找到.NET Framework v3.5 Service Pack1.若要以“.NET Framework v3.5 Service Pack1“为目标报错 解决方法

网上说是安装.NET Framework3.5,但安装起来很麻烦。这里将解决方案》项目文件》右击属性》应用程序》目标框架改为.NET Framework4可以使用

2021-07-29 14:06:32 1808

FaceNet pytorch版本

FaceNet pytorch版本

2023-02-24

华中科技大学自动化学院2020计算计网络试题.pdf

1、填空题 (3 分每题,30 分) (1) IPv6 地址 2000:0000:0000:0001:0002:0000:0000:0001 采 用 零 压 缩 法 (Zero compression)可以简写为 或 (2) 已知一个 5bit 生成多项式为 x4+x+1 ,有效信息为 10101011,其 CRC 校验码 为 。 (3) 多路访问协议(multiple access control protocol)可以划分为三大类,分别是:信道 分割、 和 。 (4) 在 IEEE 802.11 标准中(wifi), 其多路访问控制协议是 。 (5) 在 Internet 的 5 层体系结构中,传输层提供了运行在不同主机上的 之间的 逻辑通信。 (6) 如果 TCP 服务器支持 n 个并行连接,每条连接来自不同的客户主机,那么 TCP 服 务器将需要 个套接字。 (7) 运行在一台主机上的一个进程,使用 和 来标识运行在另一台 主机上的进程。 (8) 考虑一条带宽为 50KHz 的信道,若要在其上传输 1.544Mbps 的数据率,根据香农 定理信噪比不能小于 db

2020-05-29

华中科技大学自动化学院智能控制试卷2020

、(16 分)填空题(每空 1 分,共 16 分。) 1. 遗传算法中常用的 4 种基本操作为 、 和 、 。 2. 普通集合可用 函数表示,模糊集合可用 函数表示。 3. 基本模糊控制器的组成包括知识库以及 、 和 。 4.分层递阶智能控制按照自上而下精确程度 、智能程 度 的原则进行功能分配。 5.模糊系统中去模糊的常用方法包括 , 和 。 6. 模式 1**11*0*1*10 的阶次(位数)是 ,定义长度 是 。

2020-05-29

华中科技大学自动化学院自控原理II2020试卷

英文试题 1.(20 分)The discrete-time system is shown in the following figure, () s(0.1 1) k Gs s   , T=0.1. (1) Obtain the closed-loop impulsive transfer function. (2) Determine the stable range of k. (3) If k=1, Obtain e(∞) for r(t)=1(t)+t. (Note: 368 0.1 e )

2020-05-29

华中科技大学功率电子技术2020考试试题A卷.doc

密码:87541547 1、 整流是把交流电能转换成直流电能,而将直流转换为交流电能称为( ),它是对应于整流的逆向过程。 2、 电力电子器件一般工作在开关状态,当器件开关频率较高时,功率损耗主要是( )。 3、 在电力二极管选型时,电力二极管的额定电流为400A,如果考虑2倍电流安全裕量,那能通过电力二极管的电流有效值最大是( )。 4、 在电力二极管、晶闸管、电力MOSFET、IGBT四个器件中,无法形成电导调制效应来减小通态电压和通态损耗的器件是( )。 5、 温度升高时,晶闸管的触发电流随温度升高而( ),正向转折电压和反向击穿电压随温度升高而( )。(括号内填:升高 或 下降) 6、 对同一晶闸管,维持电流IH与擎住电流IL在数值大小上相比,IL ( ) IH。(括号内填:大于、小于 或 等于) 7、 功率晶体管GTR从高电压小电流向低电压大电流跃变的现象称为( )。 8、 电力MOSFET开关过程非常迅速,其开关速度和极间电容充放电有很大关系,可以通过降低( ),来加快开关速度。

2020-05-29

华中科技大学自动化学院DSP原理及应用2020试卷

2020年华科本科生期中考试DSP原理及应用试卷 一、简答题(50分,每小题5分) 1, DSP器件有哪些主要特征? 2, 什么是哈弗结构?TI的C2000采用了怎样的改进哈弗结构? 3,简述流水线技术的作用和TMS320F2802X的流水线技术。 4,简述C2000 DSP中断结构。 5,简述外设中断的响应过程。 6,简述TMS320F2802X的外部中断和eCAP的联系与区别。 7,看门狗的作用是什么?如何避免看门狗计数器溢出? 8, 简述F28027的ePWM模块中TB、CC、AQ和ET子模块的功能。 9, F28027的ADC实现过采样的机制。 10, CCS编译器产生的初始化段和非初始化段各有哪些?并简述F280C28x的C语言中的volatile、interrupt等标识符的含义。

2020-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除