- 博客(7)
- 资源 (5)
- 收藏
- 关注
原创 项目demo —— PyQt5简单画板程序
文章目录前情提要demo演示代码1. Node 节点类2. Canvas 画布类3. Editor 编辑器类前情提要最近在看强化学习,想着快速做一个 MDP 的可视化,主体是一个画板,类似visio那样的,然后可以实时运行RL算法看价值变化情况但问题是,我可视化工具就会用一个PyQt5,还是半瓶水的水平…所以就想着不要造轮子。一开始感觉这东西和自动机(DFA)或者图灵机差不多,找个可视化的开源库改改就行了,实在不行思维导图的库可能也差不多。没想到啊,真就找不到这种库,又转头去找开源代码什么的,也是寥
2021-07-20 04:38:40 1664 3
原创 线性代数(2)—— 矩阵定义及基本运算
参考:张宇高等数学基础30讲线性代数的本质1. 矩阵的本质1.1 矩阵是系统信息的表示方式我们可以把矩阵看作信息的一种表示方式。比如英语系有98个女生,2个男生;机械系有95个男生,5个女生,这个系统可以用矩阵表示如下矩阵忽略数据的现实含义,矩阵就是一组排列好的数,只要抽象地认为矩阵是一个系统信息的表达即可1.2 两个重要观点这里从向量组和线性方程组的角度补充两个认识矩阵的观点,以后再详细说明。以以下矩阵为例A=[123679246] A = \begin{bm.
2021-07-17 03:17:04 2689 15
翻译 论文翻译 —— Episodic reinforcement learning with associative memory
标题:Episodic reinforcement learning with associative memory文章链接:Episodic reinforcement learning with associative memory领域:强化学习 - 情节控制(episodic control)文章目录EPISODIC REINFORCEMENT LEARNING WITH ASSOCIATIVE MEMORY1. INTRODUCTION2 BACKGROUND3. RELATED WOR.
2021-07-16 13:43:47 852
原创 强化学习笔记(2)—— 多臂赌博机
本文在只有一个状态的简化情况下讨论强化学习中评估与反馈的诸多性质,在 RL 研究早期,很多关于评估性反馈的研究都是在这种 “非关联性的简化情况” 下进行的
2021-07-13 03:40:19 672 4
原创 NumPy笔记(1)—— 多维数组对象ndarray
参考:《利用python进行数据分析》第4章注意,由于本文是jupyter文档转换来的,代码不一定可以直接运行,有些注释是jupyter给出的交互结果,而非运行结果!!文章目录1. 引言1.1 关于NumPy1.2 NumPy的特点1.3 NumPy的主要用途1.4 说明2. ndarray2.1 生成ndarray2.1.1 array方法2.1.2 生成方法概览1. 引言1.1 关于NumPyPython中的数组计算防暑要追溯到1995年,虽然有许多编程社区开始利用python进行数组.
2021-07-08 17:51:01 425
翻译 论文翻译 —— Model Free Episodic Control
标题:Model Free Episodic Control文章链接:Model Free Episodic Control代码实现:sudeepraja Model-Free-Episodic-Control提出方法:MFEC (Model Free Episodic Control)领域:强化学习-情节控制注:方括号为原文中参考文献引用,具体引用文章请下载原文查看...
2021-07-08 03:18:41 437
转载 【转】如何读学术论文
参考:经验分享 | 高效读论文的“三遍法”【How to read a paper】如何读论文怎样阅读论文(台湾彭明辉)文章目录1. 速读后的问题记录1.1 5C1.2 另一个版本2. 期刊论文的分析技巧与程序2.1 Abstract:2.2 Introduction2.3 Main body3. 方法与应用场合特性表(有迹可寻的创意程序)4. 论文阅读的补充说明5. 论文报告的要求与技巧1. 速读后的问题记录网上找的,看起来不一定是CS领域1.1 5CCategory:这.
2021-07-06 14:41:28 239
通信协议.cpp
2019-08-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人