- 博客(63)
- 资源 (14)
- 收藏
- 关注
原创 Windows 和 Linux 下常用命令(待更新)
将模式解释为 perl 兼容的正则表达式(PCRE)。这是实验性的,grep -P 可能会警告未实现的特性。: 只显示匹配的字符串,并以单独行输出。
2024-10-26 18:07:29 261 1
原创 “Hopf Oscillator-Based Gait Transition for A Quadruped Robot“代码复现
代码实现了从静止到行走(walk)到小跑(trot)再到飞奔(gallop)步态的转换。
2024-02-09 22:47:30 478 1
原创 V-REP和Python的联合仿真
机器人仿真软件课程地址课程资料旋转变换四足机器人站立控制原理单腿逆解参考Vrep文档Vrep放大object。
2023-11-06 19:19:40 607
原创 [VUE] Web Serial API的简单示例
跨越嵌入式到云端的新型容器:WebAssembly Micro Runtime。什么,网页也能直接与硬件通信?使用 Web Serial API 在浏览器上实现基于 WEB 的串口通信。【10. 连接硬件设备至 web 应用】
2023-08-29 09:12:56 804
原创 使用VSCode创建第一个ESP-IDF项目
而只能在VSCode中使用。所以我们可以通过执行esp-idf路径的。在完全使用VSCode安装ESP-IDF环境后,不会存在。脚本来导出环境变量。下面是在任意路径下创建。进入项目目录并使用VSCode打开项目。添加ESP-IDF配置文件夹。打开监视器(monitor)运行项目:按顺序执行。
2023-05-19 14:46:46 1258
原创 一个简单的基于QT的图像浏览器
以前学习前端的时候,对于多张图片的布局一般使用瀑布流布局(),然后再通过懒加载()加载图片。但如果是在图片数量有限的情况下,无法得到整齐的布局。同时,鄙人也觉得桌面端向下滚动浏览图片实为不合理。所以在这篇文章中,我采用了横向滚动的方法,并将每一行图片使用QHeaderView布局图片,使得每一行图片都可以独立地进行滚动,以解决我们在上面提到的第一个问题。
2023-05-15 16:23:10 1285
原创 一个简单的查看URDF文件的网页
主要是使用的[urdf-loader]外加[threejs],再通过[vue]来实现的,可以在网页端查看URDF模型,并保存图片到本地。
2022-10-03 17:11:14 1332 4
原创 ubuntu 20.04 安装mujoco 210
参考链接:mujoco环境变量报错:Missing path to your environment variable._BBJG_001的博客-CSDN博客_mujoco 环境变量 Ubuntu 安装mujoco_李峻枫的博客-CSDN博客_ubuntu安装mujoco 如何在 Ubuntu 18.04 LTS 系统中安装多版本 GCC 编译器 - 系统极客 修改默认的gcc版本 sudo update-alternatives --config gcc 安装中遇到的问题 安装mujoc.
2022-05-17 14:47:33 774
原创 文件编码批量转换
# -*- coding:utf-8 -*-# @Time : 2022/3/22 20:04# @Author: zhcode# @File : convert_file_encode.pyimport chardetimport codecsimport osimport sysimport timeCURRENT_PATH = os.path.abspath('.')def code2code(filename, encode_out): fileencoding .
2022-03-22 21:03:19 1410 2
原创 cmake helloworld
CMakeLists.txtcmake_minimum_required(VERSION 3.19)set(CMAKE_MAKE_PROGRAMC "D:/MinGW/bin/make.exe")set(CMAKE_C_FLAGS "-g -Wall -I D:\\MinGW\\include -L D:\\MinGW\\lib")set(CMAKE_CXX_COMPILER "g++")set(CMAKE_CXX_FLAGS "-g -Wall -I D:\\MinGW\\include
2022-03-22 12:39:56 165
原创 Residual Reinforcement Learning for Robot Control
Residual Reinforcement Learning for Robot Control传统反馈控制方法通过显式模型来解决各种机器人控制问题。但在现代制造业中的很多控制问题都需要处理接触和摩檫力,而这些难以被一阶物理建模所体现(如果要使得传统反馈控制方法,比如PID调节器和计算转矩的方法对环境具有一定程度的适应性或反馈,则需要很多额外的努力),而另一个缺点是传统控制方法缺乏行为泛化。本文研究了如何解决现实世界中的复杂控制问题,将其分解为用传统反馈控制方法有效求解的部分和用RL方法求解的剩余部分,
2022-03-06 19:09:38 2996
原创 强化学习实践技巧
强化学习算法在一个具体问题的解决上能否起作用的关键是关于这个问题的状态空间、动作空间以及奖励函数的设计。状态空间的设计状态空间设计的两个极端是端到端和极致的特征工程。端到端的设计由于状态空间中包含许多冗余的信息,导致网络(在DRL中)不能很好地学习状态与奖励之间的关系;而极致的特征工程往往会造成 reality gap。好的状态空间设计能够保证智能体学习时环境的稳定性(状态分布以及状态的转移概率),从而使得待解决的问题成为一个MDP问题而不是POMDP问题。在Sim-to-Real minitaur
2022-03-03 09:34:00 632
原创 The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games 阅读笔记
“The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games” 阅读笔记MAPPO算法是PPO算法专用于多智能体环境的变体。PPO作为on-policy算法,在多智能体环境下有着与其他off-policy的算法相比有着相同的采样效率,并在大多数场景下有着更好的表现。MAPPO算法可以同时作为CTDE(集中训练,分散执行, 有集中的价值函数)算法或分散学习算法(分散的价值函数)。PPO代码实现细节和决定PPO算法表现的关键超参
2022-02-14 15:35:17 4962
原创 spfa算法的python实现
SPFA算法是对Bellman-Ford算法的改进,使用了队列进行了优化,在时间复杂度上,一般情况下是优于Dijkstra算法的。在SPFA算法中每次仅对最短路径估计值发生改变了的顶点的所有出边执行松弛操作。并使用队列来维护这些发生了变化的点。每次选取队首顶点u的所有边进行松弛操作,假设有一条u到v的边,如果通过这条边使得源点到顶点v的最短路程变短,且顶点v不在当前队列中,就将顶点v放入队尾。算法过程queue<int> q;源点s入队;while(队列非空){ 取出队首元
2021-12-27 11:00:27 1486 1
原创 Ubuntu20.04 执行nvidia-smi命令,显示不能连接到显卡驱动
错误:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.解决这个问题的一般方法:nvidia-smi 报错:无法与 nvidia driver 通信 - 知乎如果在执行sudo dkms install -m nvidia -v 418.87.00得到错误File: /usr/src/nvidia-470.82.00/dkms.conf does not exist...
2021-12-12 14:37:27 10099 1
原创 Ubuntu使用gym保存视频报错“Unknown encoder ‘libx264‘”
在使用gym环境训练智能体并保存视频到本地的实验中,使用Monitor保存视频的时候遇到了报错:Unknown encoder 'libx264'因为考虑到保存gym保存视频是使用的ffmpeg,所以就去重新安装了,但仍然报错。然后对wrappers.Monitor的源码进行了查看这里对选择的方式进行了判断,所以我们可以选择其他的编码器来保存我们的视频,只需要将conda安装ffmpeg卸载,然后使用其他的选项。import pkgutilimport distuti.
2021-12-07 22:27:59 3230 1
原创 基于Dijkstra算法和KM算法的网约车订单分配问题
网约车在人们的日常出行生活中扮演了十分重要的角色,它为出租车和乘客搭建了一个方便的业务平台,既减少了乘客的候车时间,又很大程度上缓解了出租车的空载现象,从而大大提高了人们的出行效率。网约车的订单分配模式一般包括抢单模式和系统派单模式,这里实现了系统派单模式下的订单分配策略,即保证所有乘客等待的时间全局最小。使用Dijkstra算法来计算每辆出租车到每个乘客的最短路径,并通过KM算法求得出租车和乘客之间的最优匹配,来保证所有出租车到乘客之间所需的行驶距离最短,从而保证乘客所需的候车时间也全局最短。...
2021-11-22 16:59:25 5585
原创 Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
多智能体强化学习的相关问题:分层强化学习(hierarchical reinforcement learning)- In Advances in neural information processing systems分层强化学习(Learning-representations-in-Model-Free-HRL)—知乎多智能体自我学习(multi-agent self-play):将RL算法扩展到多智能体环境中分层强化学习(Self-play)—知乎D. Silver, A. H
2021-11-19 22:08:10 1307
原创 在word文档里使用LaTeX数学公式字体 mathcal mathbb mathbf
因为在office2016中,英文字母的字体不能在公式中直接敲出,所以这里提供一个含有各个英文字母字体的word的文件,在使用中只需要复制就行了这里是将LaTex公式从Typora软件中导出得到的$\mathcal{A}$$\mathcal{B}$$\mathcal{C}$$\mathcal{D}$$\mathcal{E}$$\mathcal{F}$$\mathcal{G}$$\mathcal{H}$$\mathcal{I}$$\mathcal{J}$$\mathcal{K}$$\mathcal.
2021-09-16 15:53:57 13556
原创 DynaQ迷宫
1. 格子世界环境这里用了叶强大大的代码gridworld.py"""General GridWorld EnvironmentAuthor: Qiang YeDate: July 22, 2017License: MIT"""import mathimport gymfrom gym import spacesfrom gym.utils import seedingimport numpy as npclass Grid(object): d.
2021-08-05 18:14:24 706
原创 强化学习随机游走
实现随机游走实现TD(0)算法和α\alphaαMC算法并进行比较import warningsfrom IPython.core.interactiveshell import InteractiveShellwarnings.filterwarnings("ignore")InteractiveShell.ast_node_interactivity = "all"import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'
2021-08-02 08:55:25 879
原创 图片格式png转jpg批量转换
import shutilfrom PIL import Imageimport osimport sysimport timeCURRENT_PATH = os.path.abspath('.')def main(): try: if len(sys.argv) <= 1: convert() elif sys.argv[1] == '-h': helper() else: .
2021-07-31 22:52:11 219
原创 使用单个Dockerfile部署Nginx+Flask+Mongo
MongoDB如何查看版本信息详解使用Docker部署Nginx+Flask+Mongo的应用Dockerfile方式1. 目录结构2. DockerfileFROM ubuntu:18.04# 设置时区ENV TZ=Asia/ShanghaiRUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone# flaskENV FLASK_WORKDIR
2021-05-14 10:24:15 251
原创 c++链表排序
参考//// Created by zhang on 2021/3/15.//#include <iostream>#include <string.h>using namespace std;//定义学生节点typedef struct studentNode{ string stuId;// string stuName;// string Id;// string Institute; string stuTyp
2021-03-17 10:45:47 1936
原创 c++中文数组
#include<bits/stdc++.h>using namespace std;int main() { char ss[100][20] = {"这", "是", "一", "个", "数", "组"}; char temp[20]; int i = 0; while(strcpy(temp, ss[i++])[0] != '\0') { printf("%s ", temp); .
2021-03-08 11:53:56 1530 3
原创 sqlalchemy 创建表并设置默认值
models.py# -*- coding: utf-8 -*-import datetimefrom sqlalchemy import Column, String, Integer, CHAR, TIMESTAMPfrom sqlalchemy.ext.declarative import declarative_base# 创建对象的基类Base = declarative_base()# 自定义数据库对象的基类class BaseModel(): """
2021-02-22 18:07:32 1857
原创 pyinstaller打包pygame可执行程序经验
参考网址:pyinstaller 打包程序的相对路径问题**第一步,**通过上述参考网址讲程序打包为目录可执行程序我按照上方参考网址做了之后,还是会报找不到目录的问题,所以我进行了第二步**第二步,**讲引用的资源文件移入打包的文件的根目录结果:...
2020-07-28 17:32:52 495
原创 pandas时间序列空值填充
1.读入csv文件novels_month = pd.read_csv(csv_path)2.生成时间索引#2004-12-1是时间序列开始的时间,并以月为间隔rng = pd.date_range('2004-12-1', periods = int((pd.Period(novels_month.iloc[-1,0],'M') - pd.Period('2004-12-1','M')).freqstr[0:-1]), freq = 'M') + pd.Timedelta('1 da..
2020-05-17 16:18:40 2937
一个简单的基于QT的图片查看器
2023-05-15
基于VUE实现的URDF文件在线查看网页
2022-10-03
caj文件转pdf文件Windows x86_64版本
2022-07-14
"Sim-to-Real: Learning Agile Locomotion For Quadruped Robots"代码
2022-02-09
"Sim-to-Real: Learning Agile Locomotion For Quadruped Robots"环境
2022-01-25
graph.json 基于Dijkstra算法和KM算法的网约车订单分配问题的输入文件
2021-11-22
png转jpg批量转换
2021-07-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人