自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 Win10中Python3.8调用动态链接库时报错:FileNotFoundError: Could not find module解决方案

目录1 问题2 原因 3 解决方案在python3.8中调用动态链接库时报错,代码如下报错信息为:FileNotFoundError: Could not find module 'D:\PycharmProject\AutoNeck\platform\percipio_cam.dll' (or one of its dependencies). Try using the full path with constructor syntax.具体如下图所示 这段程序放在python3.6环境中运行是没

2022-06-28 11:26:47 14456 5

原创 安装TensorRT时出现ModuleNotFoundError: No module named ‘packaging‘解决方案

安装TensorRT时出现错误:ModuleNotFoundError: No module named 'packaging'。缺少packaging库。终端输入:如果这时候出现错误:ERROR: Could not install packages due to an OSError: Missing dependencies for SOCKS support。终端输入:...

2022-06-20 15:07:34 17338

原创 使用torchsummary时出现AttributeError: ‘list‘ object has no attribute ‘size‘解决方案

使用torchsummary查看网络结构时报错:AttributeError: 'list' object has no attribute 'size',具体如下图所示。torchsummary的问题,其实还有一个跟它长得很像的库,叫做torch-summary,中间多了一个横杠,它是torchsummary的加强版。这里我们卸掉torchsummary库,安装torch-summary库,上面的问题就可以解决了。4 代码......

2022-06-18 20:45:56 5622 16

原创 AttributeError: module ‘distutils‘ has no attribute ‘version‘ 解决方案

PyTorch版本1.10,安装完tensorboard后运行代码时出现错误:AttributeError: module 'distutils' has no attribute 'version'。setuptools版本过高。

2022-06-18 11:21:54 44913 14

原创 图漾深度相机FS-820在Windows上的使用流程

前段时间用过一款图漾的双目深度相机,型号为FS-820,开发工具为Python,这里记录一下在Windows系统上的使用流程,包括一些踩过的坑,给有同样需求的小伙伴们提供一些参考。这部分可以直接参考官网:图漾双目深度相机开发说明文档,里面有详细说明。具体过程如下:1. 下载Camport3 SDK 2. 安装依赖,主要包括CMake和OpenCVCMake安装参考视频链接:安装CMakeOpenCV安装参考视频链接: 安装OpenCV另外还需要安装visual studio,用来编译整个工程。这里我安装的是

2022-06-15 16:12:02 1342 3

原创 “OSError: [WinError 1455]页面文件太小,无法完成操作。”解决方案

引言某次在Windows系统上跑深度强化学习多进程程序时报错:OSError: [WinError 1455]页面文件太小,无法完成操作。具体错误如下图所示最后借助这篇博文:多种方法彻底解决pycharm中: OSError: [WinError 1455] 页面文件太小,无法完成操作 的问题,顺利地把问题解决了,因此特意做个笔记记录一下。如果有小伙伴遇到同样的问题,希望这篇博文能够对你有所帮助。问题原因报的错误是页面文件太小,所以需要调大页面文件的大小 (你搁这搁这呢)。其实,电脑在默

2022-05-30 12:52:27 97253 38

原创 深度强化学习-TD3算法原理与代码

引言Twin Delayed Deep Deterministic policy gradient (TD3)是由Scott Fujimoto等人在Deep Deterministic Policy Gradient (DDPG)算法上改进得到的一种用于解决连续控制问题的在线(on-line)异策(off-policy)式深度强化学习算法。本质上,TD3算法就是将Double Q-Learning算法的思想融入到DDPG算法中。前面我们已经分别介绍过DDPG算法和Double DQN算法的原理并进行了代

2022-05-03 09:24:47 46973 37

原创 深度强化学习-确定性策略梯度算法推导

引言前面我们详细推导过策略梯度算法,如果有小伙伴对这个算法的推导过程比较感兴趣的话,可以看一下我的这篇博文:深度强化学习-策略梯度算法推导。在连续的动作空间中,动作的个数是无穷大的。如果采用常规方法,需要计算。而对于无穷多的动作,最大值往往很难求得。为此,D.Silver等人在文章《Deterministic Policy Gradient Algorithm》中提出了确定性策略的方法,用于处理连续动作空间问题。本文将针对连续动作空间,推导出确定性策略的策略梯度算法。1 确定性策略梯度算法对于.

2022-04-27 20:00:03 3045 2

原创 深度强化学习-DDPG算法原理与代码

引言Deep Deterministic Policy Gradient (DDPG)算法是DeepMind团队提出的一种专门用于解决连续控制问题的离线式(off-line)深度强化学习算法,它其实本质上借鉴了Deep Q-Network (DQN)算法里面的一些思想。本文就带领大家了解一下这个算法,论文和代码的链接见下方。论文:https://arxiv.org/pdf/1509.02971.pdf代码:https://github.com/indigoLovee/DDPG喜欢的话请点个s

2022-04-24 10:24:12 78676 55

原创 Ubuntu18.04中编译SQLite3库

1 概述熟悉C语言编程的小伙伴们应该都知道,我们在采用C语言开发项目时,一般会包括头文件、源文件或者库文件。那么这些文件主要存储什么内容呢,这里给大家简单介绍一下。头文件中主要包括函数的声明,告诉编译器存在某些函数。源文件中主要包括函数的实现,即具体是做什么的。这两个文件都比较好理解,下面重点介绍一下库文件。通常我们在开发好一个项目后,希望用户可以正常调用我们开发好的API,但是又不希望他们看到具体的函数实现。此时我们就可以将函数实现部分打包成一个库,用户在拿到库文件和头文件后即可调用,而不

2022-04-06 21:47:08 1898

原创 Matlab双目相机标定

1 概述现在有许多双目相机在出厂时就已经标定好了,用户拿到手后可以直接使用,例如Intel Realsense系列。但是有些相机出厂的时候并没有完成标定工作,因而这个时候就需要我们自己来标定。由于笔者曾改装过一个双目相机,最远可以测至50m,因此有一定的心得体会想给大家分享一下。本文主要介绍双目相机标定的整个过程,以及导出标定数据的方法。相机标定主要分为手动标定和自动标定,手动标定比较繁琐,这里主要介绍基于matlab工具箱的自动标定方式来对双目相机进行标定。具体的相关标定细节也可以参照这篇博客:m

2022-04-01 16:22:31 23858 57

原创 C语言操作SQLite

1 下载源代码采用C语言操作SQLite数据库时需要引入sqlite3库,我们可以在官网下载源代码后编译。2 C代码-不用回调函数执行SQL语句#include <stdio.h>#include <stdlib.h>#include <sqlite3.h>int main(void){ sqlite3 *db; //数据库 sqlite3_open("test.db", &db); //打开数据库 c

2022-03-31 16:48:30 4671 1

原创 SQLite数据库

安装WindowsSQLite3官网:https://www.sqlite.org/index.htmlLinux sudo apt install sqlite3基本概念数据库是一个按数据结构来存储和管理数据的计算机软件系统。数据库是一个实体,它是能够合理保管数据的“仓库”,用户在该“仓库”中存放要管理的事务数据,“数据”和“库”两个概念结合成为数据库。数据库是数据管理的新方法和技术,它能更合适的组织数据、更方便的维护数据、更严密的控制数据和更有效的利用数据。基本语法

2022-03-31 15:17:27 4445

原创 Pycharm中同级目录下如何调用其他脚本

Pycharm是我们在做Python程序开发时常用的IDE。通常在一个比较大的工程中,我们会把不同模块的代码放在不同的文件夹中,从而便于管理。然而,此时可能会出现两类问题:调用某个脚本中的函数或者类时存在红色波浪线;同级子目录下无法相互调用。要解决这个问题其实很简单,步骤如下:在工程名上右击——>Mark Directory as——>Sources Root这时脚本中的红色波浪线都会消失,同级目录下也可以相互调用。...

2022-02-21 16:09:05 1866

原创 更新pip版本指令

使用如下指令更新pip,可能会出错pip install --upgrade pip使用如下指令即可完美更新pippython -m pip install --upgrade pip

2022-02-01 10:03:56 15201 2

原创 深度强化学习-Pytorch环境配置

引言“工欲善其事,必先利其器”,环境配置是开展Coding的第一步。我用过TensorFlow和Pytorch两种深度学习框架,对比下来更喜欢Pytorch。如果有小伙伴纠结使用哪个框架,我更加推荐Pytorch。本文主要跟大家讲解一下如何搭建Pytorch环境。1 安装Anaconda通过Anaconda3,我们可以创建多个不同的Python环境,并且控制Python版本。大家可以直接去Anaconda官网下载,不过建议去Aanconda清华镜像源下载,下载速度更快。我用的是Anaconda3

2022-01-24 19:09:17 7659 7

原创 深度强化学习-带基线的策略梯度算法原理

引言本文主要介绍策略梯度算法的一种改进——带基线的策略梯度算法(Reinforce with baseline)。通过引入基线,有效降低了学习过程中的方差,从而提升训练过程的稳定性。1 基线基线函数可以是任意随机函数或确定函数,它可以与状态有关,但是不能和动作有关。满足这样的条件后,基线函数自然满足证明:由于和动作无关,所以进而得证。...

2022-01-23 18:17:19 3686 2

原创 深度强化学习-策略梯度算法(Reinforce)代码

引言本文主要采用Pytorch来实现策略梯度算法,算法的原理可以参考我的这篇博文:深度强化学习-策略梯度算法推导,里面对该算法进行了详细推导。如果想深入理解策略梯度算法公式,可以参考我的另一篇博文:深度强化学习-策略梯度算法深入理解,里面将其与手写数字识别问题进行了类比,深入剖析了策略梯度算法公式。代码已经上传到我的Github上,喜欢的话可以点个小星星噢。代码:https://github.com/indigoLovee/Reinforce_pytorch1 Reinforce算法强化学习

2022-01-11 20:44:54 6489 2

原创 深度强化学习-策略梯度算法深入理解

1 引言在深度强化学习-策略梯度算法推导博文中,采用了两种方法推导策略梯度算法,并给出了Reinforce算法的伪代码。可能会有小伙伴对策略梯度算法的形式比较疑惑,本文就带领大家剖析其中的原理,深入理解策略梯度算法的公式。本文主要参考了百度飞桨的视频Policy Gradient算法有兴趣的小伙伴可以看看,我觉得讲的非常透彻。2 手写数字识别我们先来看一下手写数字识别案列,采用LeNet网络,其输入为一张手写数字照片,输出为0-9每个数字对应的概率。LeNet网络结构不是本文介绍的重点,我们主要

2022-01-03 19:21:35 3662 1

原创 深度强化学习-策略梯度算法推导

之前我们讨论过DQN算法:深度强化学习-DQN算法原理与代码、Double DQN算法:深度强化学习-Doubel DQN算法原理与代码、Dueling DQN算法:深度强化学习-Dueling DQN算法原理与代码以及D3QN算法:深度强化学习-D3QN算法原理与代码,这些算法在求解最优策略的过程中试图估计最优价值函数,所以这些算法都被称为最优价值算法(optimal value algorithm)。但是求解最优策略梯度不一定要估计最优价值函数,策略梯度算法(policy gradient algo

2022-01-01 19:43:28 5261 3

原创 深度强化学习-D3QN算法原理与代码

Dueling Double Deep Q Network(D3QN)算法结合了Double DQN和Dueling DQN算法的思想,进一步提升了算法的性能。如果对Doubel DQN和Dueling DQN算法还不太了解的话,可以参考我的这两篇博文:深度强化学习-Doubel DQN算法原理与代码和深度强化学习-Dueling DQN算法原理与代码,分别详细讲述了这两个算法的原理以及代码实现。本文就带领大家了解一下D3QN算法,代码链接见下方。代码:https://github.com/indigo

2021-12-15 10:01:32 24760 22

原创 深度强化学习-Dueling DQN算法原理与代码

Dueling Deep Q Network(Dueling DQN)是对DQN算法的改进,有效提升了算法的性能。如果对DQN算法还不太了解的话,可以参考我的这篇博文:深度强化学习-DQN算法原理与代码,里面详细讲述了DQN算法的原理和代码实现。本文就带领大家了解一下Dueling DQN算法,论文链接见下方。论文:http://proceedings.mlr.press/v48/wangf16.pdf代码:后续会将代码上传到Github上...1 Dueling DQN算法简介Duelin

2021-12-13 10:39:18 35136 16

原创 深度强化学习-Double DQN算法原理与代码

Double Deep Q-learning(DDQN)是对DQN算法的改进,有效提升了算法的性能,本文就带领大家了解一下这个算法,Double Q-learning算法的论文链接见下方。论文:https://ojs.aaai.org/index.php/AAAI/article/view/10295代码:后续会将代码上传到Github上...1 DDQN算法简介...

2021-12-11 13:31:12 42158 30

原创 深度强化学习-DQN算法原理与代码

DQN算法是DeepMind团队提出的一种深度强化学习算法,在许多电动游戏中达到人类玩家甚至超越人类玩家的水准,本文就带领大家了解一下这个算法,论文的链接见下方。论文:https://www.nature.com/articles/nature14236.pdf代码:后续会将代码上传到Github上...1 DQN算法简介Q-learning算法采用一个Q-tabel来记录每个状态下的动作值,当状态空间或动作空间较大时,需要的存储空间也会较大。如果状态空间或动作空间连续,则该算法无法使用。因

2021-12-10 14:02:33 45347 36

原创 AttributeError: module ‘gym.envs.box2d‘ has no attribute ‘LunarLander‘ 解决方案

AttributeError: module 'gym.envs.box2d' has no attribute 'LunarLander' 解决办法

2021-12-09 20:30:47 8304 9

原创 采用labelme制作关键点检测数据集

采用labelme制作关键点检测数据集

2021-12-08 20:04:00 13957 23

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除