自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【CS 143 Compiler】Assignment 4.1:阅读源码 & 理解任务

Spim 手册中的图示如下,编译器输出的 目标文件(Object File)布局为:代码存放在.text段,而代码的总入口是_start_start会做一些准备工作(包括初始化垃圾处理程序, 初始化 Main 函数) 最后调用 Main 对象实例 中的 main 方法 开始执行 COOL 程序._start作为入口符号是链接器的默认设置(也可以自定义)。_start也是大多数编程语言的 runtime 的入口函数。_start作为引导程序,包括一些准备工作,然后引导进入主程序。

2023-02-04 09:41:53 189

原创 【CS 143 Compiler 编译原理】Assignment 3:静态语义分析

总的来说分为 建立依赖图(build_inherit_graph)、验证无环(verify_acyclic)两步。install_basic_class 将基础类(如 Object、IO、Int、String)预先加入,和用户定义的 Class 一并处理。依赖图的构造遵顼一个 先定义节点再连线 的顺序。(因为建立继承关系时需要维护父节点的入度,这就需要父节点已经存在,所以需要所有节点定义完成后在连线。定义节点的过程嵌入重复定义的检查,只留下去重的 class 集合。

2023-01-30 16:00:06 258

原创 【CS 285 DRL Homework 2】Policy Gradients 策略优化

CS 285 深度强化学习 Homework 2 思路总结

2023-01-18 18:44:17 106

原创 【CS 143 Compiler 编译原理】Assignment 3:语法分析

这篇文章主要总结 完成 这次 Assignment 3 所需 知识和思路的总结

2023-01-17 00:18:13 247

原创 【CS 285 DRL Homework 1】模仿学习的策略函数

关于 CS 285 深度强化学习 Homework 1 的笔记很少,百度到 前年 一位同学发在 CSDN 上的笔记,感觉有点不太对。。 这里写一些个人理解,敬供各位批评。 策略(Policy)函数的实现 连续动作空间 & 高斯策略实现 首先明确,这里的 “连续动作空间” ( ) 就是单峰的高斯分布。即 动作向量的每个分量连续、独立且分别服从不同参数的高斯分布。 因此首先如果是高斯函数 ( ) , 则 待估计的 未知参数为 期望和标准差。动作值期望随观测值不同而变化。因此反映在 Pytorch 的

2023-01-05 16:14:41 280 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除