- 博客(27)
- 资源 (1)
- 收藏
- 关注
原创 行为树基本概念与BehaviorTree.CPP库在C++的代码实现
文章介绍了行为树的基本概念以及介绍了MIT开源的行为树实现库——BehaviorTree.CPP的使用,包含部分C++的代码实现
2023-12-25 13:30:51
2219
原创 【STM32】Keil V5联合VSCode配置代码编写与下载环境,解决报错问题
VScode中配置keil的编写环境,解决头文件索引、STM32关键字波浪线报错等环境问题
2023-07-18 11:14:47
4958
原创 【视觉入门】——空域图像增强(邻域运算部分):图像卷积、多种滤波器;二值图像分析及形态学图像处理
本篇接上篇,介绍了空域图像增强方法中的领域运算,也即卷积运算。并基于此介绍了多种滤波器。最后,补充了二值化相关与形态学图像处理的相关知识
2022-11-16 02:26:02
1710
3
原创 【视觉入门】——图形处理基础知识、BMP图像文件介绍、空域图像增强(点运算部分)——图像间变换、灰度变换、直方图变换
本篇博客主要介绍了图形处理的入门基本知识,相关的图像概念,以及空域图像增强的点运算部分
2022-11-16 00:39:11
2003
原创 Ubuntu18.04安装配置使用Intel RealSense D435i深度相机以及在ROS环境下配置
最近因为学习开发需要,要开始接触一些视觉相关的内容,拿到了一个Inter 的D435i深度相机,记录一下在Ubuntu18环境下配置SDK 包的历程。
2022-11-10 12:21:59
5167
7
原创 【数字信号处理】基于Matlab Designer制作的信号生成、叠加与检测器
工程测试技术课程作业,实现不同信号的输入与叠加以及实时观测,并使用matlab自带的播放功能,可以从听觉上感知信号的输出。
2022-10-30 11:58:49
1321
2
原创 DQN网络代码调用env.reset()后存储观测信息报错问题ValueError: setting an array element with a sequence.解决处理
**reset()函数返回的是一个array类型以及其中数据的type!模拟游戏进行学习任务。因此需要将observation指定为真正需要的array信息即可,得到的的变量observation类型与Agent存储时的。因此怀疑返回的observation有问题,于是通过。报错信息提示为数据维度不对应,也即最初通过。在强化学习DQN网络代码实现过程中,针对。
2022-10-27 16:14:25
3347
3
原创 【从RL到DRL】深度强化学习基础(五)离散控制与连续控制——确定策略梯度方法(DPG)、使用随机策略进行连续控制
本文为深度强化学习基础的第五篇,介绍了从离散控制进阶到连续控制,分别介绍了确定策略梯度方法进行连续控制,以及使用随机策略进行连续控制
2022-10-22 11:29:49
817
原创 【从RL到DRL】深度强化学习基础(四)——策略梯度中的Baseline,Reinforce与A2C的对比
本文Hi胜读强化学习基础的第四篇博客,主要学习记录了策略梯度中使用Baseline方法来降低动作价值函数的方差,提高收敛速度;并介绍了A2C方法,分析了其与Reinforce的联系与差别。
2022-10-22 00:16:55
716
原创 【从RL到DRL】深度强化学习基础(三)——蒙特卡洛算法、TD算法改进:经验回放与高估问题的优化——Target网络与Double DQN,DQN结构改进——Dueling网络
本文为深度强化学习的第三篇,承接上篇介绍了蒙特卡洛算法的应用,并结合TD算法的具体缺点,从两个角度介绍了两个改进方案——经验回放与高估问题优化,最后介绍了对DQN网络结构的优化——Dueling Network 结构
2022-10-19 19:25:34
966
原创 【从RL到DRL】深度强化学习基础(二)——Actor-Critic Methods中策略与价值网络机构以及算法迭代过程、实例分析——AlphaGo的训练过程、蒙特卡洛树初步
本文是深度强化学习基础的第二篇,从AC算法的角度接入,并介绍了AlphaGo的训练流程以及其中涉及到的相关知识。
2022-10-15 10:28:51
987
原创 【从RL到DRL】深度强化学习基础(一)——基本概念、价值学习(DQN与TD算法)、策略学习与策略梯度
本篇为深度强化学习基础的第一篇,回顾并介绍了强化学习中的一些基本概念,并初步阐释了神经网络在策略学习与价值学习中的应用。
2022-10-14 00:09:38
1176
原创 【从RL到DRL】强化学习基础(三)——动态规划、小型网格世界中的随机策略评估
本文为强化学习基础的第三篇内容,主要记录了基于动态规划方法求解贝尔曼期望方程的迭代算法,以及相应的迭代策略评估、策略迭代、价值迭代内容
2022-10-08 00:05:41
744
原创 【从RL到DRL】强化学习基础(二)——马尔可夫决策过程与相关贝尔曼方程
本文为强化学习基础的第二篇内容,主要围绕马尔可夫性质与马尔可夫奖励、决策过程展开,并通过回溯图等形式深入分析了贝尔曼方程与贝尔曼最优方程的组成与意义
2022-10-04 16:47:42
1264
原创 【从RL到DRL】强化学习基础(一)——强化学习基本介绍、基本的智能体概念
本文开始入门学习强化学习,主要介绍了强化学习本身的一些特点以及与智能体分类、基本组成相关的一些基本概念
2022-10-01 09:40:46
1181
原创 Unitree A1 Motor新版SDK在lys_ws工作空间配置移植
针对lys_ws的新版Unitree_A1_motor SDK移植步骤详解
2022-09-30 01:20:16
481
原创 人工智能原理自学(五)——序列依赖问题、循环神经网络与LSTM网络自然语言处理实践
人工智能原理入门的最后一篇内容,主要实现了基于循环神经网络的语言处理过程,初步介绍了经典RNN网络结构以及LSTM网络结构
2022-09-29 16:58:51
688
原创 人工智能原理自学笔记(三)——Keras入门,搭建简单的神经网络框架
Keras框架就如同机器学习里的高级语言,实现了对机器学习神经网络底层复杂的数学运算的封装,我们可以轻松地通过它提供的各种上层接口搭建模型。
2022-09-25 08:49:59
219
原创 【计算机三级嵌入式】考试自学笔记(四)——I/O接口与设备、典型嵌入式处理芯片:S3C2410以及嵌入式系统的外部通信接口
【计算机三级嵌入式】考试自学笔记(四)——I/O接口与设备、典型嵌入式处理芯片:S3C2410以及嵌入式系统的外部通信接口
2022-09-23 13:35:10
2361
原创 【计算机三级嵌入式】考试自学笔记(三)——嵌入式系统硬件组成、嵌入式处理芯片以及存储器介绍
本篇为计算机三级嵌入式备考自学笔记,主要介绍了常见的嵌入式系统的硬件结构组成,并介绍了嵌入式系统存储器的种类、区别于应用
2022-09-22 00:25:29
2709
原创 【计算机三级嵌入式】考前学习笔记(二)——基本寻址方式、ARM指令集与伪指令介绍
备考计算机三级嵌入式时的一些笔记,本篇主要介绍ARM指令相关的内容,以及与指令运行相关的ARM寻址方式等内容
2022-09-21 20:57:17
747
原创 人工智能原理自学(二)——激活函数、隐藏层神经元以及高维空间
本文为人工智能原理自学笔记第二篇,主要学习实践了激活函数Sigmoid函数以及理解了隐藏层神经元的概念,并初步接触了高维空间
2022-09-15 17:06:53
748
1
原创 【材料力学】基于Matlab APP Designer 开发的绘制静定梁剪力、弯矩与挠曲线的软件
这篇博客算是对上一篇绘制挠曲线博客的续写,之前编写的绘制挠曲线的程序还是有一些漏洞和缺点的(说白了就是有点烂),此外也仅仅可以求算铰支梁在受到集中力或者是集中力偶矩时的挠度。所以这次干脆一不做二不休(其实是懒得再去改那篇博客),在我之前程序的基础上,完成了之前缺失的悬臂梁以及均布载荷两部分内容,并将最后的核心代码做成了UI,方便使用,供大家交流参考。但是从程序设计的角度来看,这样的分类其实是有冗余与欠妥的。对于简支梁与...
2022-07-09 11:16:38
4620
4
原创 材料力学:使用matlab绘制铰支梁在多个集中力、集中力偶矩作用下的挠曲线
梁的弯曲变形时材料力学中十分重要的研究内容,笔者自行设计了matlab代码以求算通过铰支座固定的梁,在多个外加集中力或是集中力偶矩的作用下,绘制梁统一的挠曲线(悬臂梁与集中载荷功能后续开发)。如有错误,欢迎交流指正。...
2022-05-31 19:42:45
3804
5
基于Matlab Designer制作的信号生成、叠加与检测器
2022-10-30
材料力学基于Matlab 开发的绘制静定梁剪力、弯矩与挠曲线的软件
2022-07-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人