人工智障
文章平均质量分 57
墨水兰亭
这个作者很懒,什么都没留下…
展开
-
关于机器人坐标系变换的笔记
机器人坐标系的变换,涉及了平移和旋转,在TF树中,我们可以得到Translation(平移)和Rotation(旋转)。base_link 下的[0,0,0]点经过旋转和平移,变成了[-0.04,0,1.2],相对于base_link。意思为,从源坐标系base_link,到目标坐标系head_link1的变换关系,结果如下所示。如果没有旋转,只有平移,H矩阵的R为单位矩阵,从base_link 到 head_link1。机器人的base_link在底部,头在1.2米的地方(平移),旋转基本没有。原创 2023-02-21 22:55:15 · 1352 阅读 · 0 评论 -
ubuntu 迅飞语音识别报错20006
EVENT_ERROR:20006 ERROR info is start cae audio record failed.原创 2022-10-20 15:12:23 · 659 阅读 · 0 评论 -
关于模型推理速度
一些低FLOPs的模型efficientNet,ghostnet等,在GPU上的推理速度并不会比resnet快,原因是深度可分离卷积depthwise这里操作具有大量的数据读写,比普通卷积高好几个量级,在读写中损耗的时间远大于浮点计算量节省的时间。实际测试发现在GPU(GTX2070)上,ghostnet的推理速度比resnet慢40%在CPU(i7-10700)上,ghostnet的推理速度比resnet慢10%。要知道ghostnet的浮点操作数要低一个数量级以上估计在低算力的处..原创 2021-07-15 11:05:01 · 1612 阅读 · 1 评论 -
pycuda对图像的并行处理
上文提到对从深度图生成点云,需要对每一个像素点进行转换。如果要对很多图像进行深度和点云的转换,在cpu中是极其耗费时间的,因此这里介绍使用cuda在gpu中进行深度点云转换。pycuda的安装自行百度,这里只介绍使用。1.首先构造cuda程序,这里可以看到,pycuda使用时候主题还是c语言,在python中通过字符串的形式表示。import pycuda.autoinitfrom pycuda.compiler import SourceModuleimport pycuda.gpuar原创 2020-09-08 20:31:33 · 935 阅读 · 0 评论 -
ubuntu18.04 安装测试ros cartographer
从工程的角度来看,Google开源的SLAM真是上乘之作,以下为cartographer安装步骤,详细,且让新手少进坑,步骤经过优化,节省大量时间。ROS版本为melodic 系统为Ubuntu18.04 工作空间名称为carto_ws//安装工具sudo apt-get updatesudo apt-get install -y python-wstool python-rosdep ninja-build//初始化工作空间mkdir carto_ws && cd c原创 2020-07-28 15:53:07 · 1882 阅读 · 0 评论 -
ROS melodic 无法键盘控制turtlebot3在gazebo中仿真的问题
为了在gazebo中对turtlebot3进行仿真,依照了以下两个教程进行了配置https://www.ncnynl.com/archives/201702/1391.htmlhttps://www.ncnynl.com/archives/201702/1398.html但是在实际运行中,分别在两个终端运行roslaunch turtlebot3_gazebo turtlebot3_world.launch以及 rosrun turtlebot3_teleop turtlebo.原创 2020-07-08 18:08:42 · 3064 阅读 · 3 评论 -
ROS action方式实现与其他数据节点交互
实验说明:如图所示有三个节点,随机数生成的/random_number_generator、action服务器、action客户端。思路就是通过action服务器监听其它节点数据,客户端给出目标需要,当监听到的数据达到客户端要求时候停止。设置.action文件#goal definitionfloat32 order---#result definitionfloat32 result---#feedbackfloat32 data生成随机数的节点程序:#!/usr/b原创 2020-07-08 16:39:26 · 422 阅读 · 0 评论 -
强化学习——离散任务—Qlearning数字迷宫问题
任务概述:数字迷宫任务,如下表所示,4、9、11、12、23、24、25是陷阱,15是出口,出生点位置任意,学习求生之路(达到15位置)1 2 3 4(F) 5 6 7 8 9(F) 10 11(F) 12(F) 13 14 15(O) 16 17 18 19 20 21 ...原创 2019-11-27 15:39:07 · 1853 阅读 · 1 评论 -
关于感受野和DepthWise卷积
感受野:感受野的定义是卷积神经网络输出的特征图上每个像素点在原始图像(网络的输入图像)上映射的区域大小,感受野的值越大表示其能接触到的原始图像范围越大,意味着蕴含更全局、语意层次更高的特征;感受野越小,特征越局部和细节。感受野的计算:r代表感受野大小,k代表卷积核(k*k),s代表步长,则感受野计算公式为:第n层感受野大小=上一层感受野大小+(第n层卷积核大小-1)乘以本层以...原创 2019-07-15 11:13:16 · 946 阅读 · 2 评论 -
Mask-RCNN代码梳理与学习
github代码:https://github.com/matterport/Mask_RCNN我们从coco.py看起:1.数据、参数和模型的读入:一系列参数的设定 : args = parser.parse_args() ...... # Configurations if args.command == "train": con...原创 2019-06-06 21:18:44 · 1599 阅读 · 0 评论 -
目标检测yolo3模型压缩
keras保存的为.h5模型,而tensorflow中模型压缩需要的是.pb的二进制文件。因此,首先需要将h5文件转换为pb文件。from keras.models import load_modelimport tensorflow as tfimport osimport os.path as ospfrom keras import backend as K#路径参数inp...原创 2019-04-10 14:27:47 · 3545 阅读 · 1 评论 -
yolo转载总结
本文来自 CSDN 网站,作者 EasonApp。作者专栏: http://dwz.cn/7ZGri...转载 2018-11-03 10:25:54 · 275 阅读 · 0 评论 -
看Yolo3代码的笔记(写得也就自己能到懂)
对github上keras版本的yolo3程序的解读:https://github.com/experiencor/keras-yolo3 一定要对着代码看第一部分 ——整体:从train.py开始看,只要这个运行步骤看懂了,其它的就都懂了。主函数(就两步):1.创建了一个解释器,将config.json的文件读入2.将读入的数据放到_main_函数中处理_main_函数:...原创 2018-11-17 20:47:59 · 5740 阅读 · 10 评论 -
ROS 参数服务器
简单介绍一下ROS中的参数服务器,废话不多说直接上程序:#!/usr/bin/env python# coding:utf-8import rospydef param_demo(): rospy.init_node("param_demo") rate = rospy.Rate(1) while(not rospy.is_shutdown()): ...原创 2019-01-17 22:13:46 · 437 阅读 · 0 评论 -
机器人的语音交互——基于讯飞和seq2seq问答
目的: 实现可以语音交流的问答机器人。步骤: 1. 讯飞语音识别(输入) 2. seq2seq 问答 3. 讯飞语音合成(输出) 4. 整合1. 讯飞语音识别(输入) 思想:从麦克风输入,通过科大讯飞的在线语音识别SDK(需要联网),将语音输入保存为txt文件。首先,需要一个科大讯飞...原创 2019-01-13 20:24:33 · 3372 阅读 · 0 评论 -
ROS话题和服务
基本概念:ROS中有四种通信方式:Topic(话题)、Service(服务)、Parameter Serivce(参数服务器)、Actionlib(动作库)。所谓通信,ros中每个程序包是一个node(节点),通信就是节点与节点间的数据传输,在这里简要介绍一下话题与服务话题与服务的简单比较 Topic话题 Service服务 节点A——>话题T (节点A发布话...原创 2019-01-16 15:22:36 · 7490 阅读 · 2 评论 -
Ubuntu16.04 ROS Kinetic版本使用PocketSphinx进行语音识别
在正文之前,先介绍一下speech_recognition这个工具包,可以调用google、Sphinx、IBM等多个语音识别的方法进行调用。https://realpython.com/python-speech-recognition/https://github.com/Uberi/speech_recognition下面进入正文,实现ROS Kinetic版本中使用Pocket...原创 2019-02-24 22:20:54 · 2186 阅读 · 3 评论 -
pb转tflite
tensorflow官方模型转换教程https://tensorflow.google.cn/lite/converttensorflow1.8版本好像一些功能没有,我们还是通过bazel的方式转换bazel build tensorflow/lite/toco:tocobazel-bin/tensorflow/lite/toco/toco --input_file='../...原创 2019-04-12 20:36:46 · 4413 阅读 · 4 评论 -
基于tflearn和全连接神经网络方法做kaggle上 titanic的题目
在我学习用tflearn过程中,发现,其实在tflearn官网上由example,就是做一个titanic的题目。那么言归正传,我们首先从kaggle上下载下来列train.csv和test.csv两个文件,使用tflearn中的load_csv来读取train.csv文件如何读取文件的代码如下:import numpy as npimport tflearnimpor原创 2017-12-24 20:51:24 · 602 阅读 · 0 评论