深度学习
文章平均质量分 88
深度学习
light169
这个作者很懒,什么都没留下…
展开
-
Google X开源抓取机械臂,无需人工标注就能一眼找到目标零件[转]
【转自】谷歌 Google X 开源抓取机械臂,无需人工标注就能一眼找到目标零件,正确率达 87.8%_机械臂常见,但你见过这么聪明的吗?从工作台上一眼找到合适的螺母、稳稳拿住。再送到目标螺杆上,整个动作一气呵成:即使是相似度极高的两个部件,也能准确区分并“揪”出正确的那个:要知道,平时我们自己做实验、或是拼装没见过的机械零件时,面对各个相似的零件都可能拿错,更何况机器人。(想象一下拼装乐高零件的痛苦)但这只机械臂没有使用过任何人工标注,就能从模拟器立刻迁移到...转载 2022-05-26 14:47:55 · 506 阅读 · 0 评论 -
姿态估计之基础知识
An Intuitive Explanation of Convolutional Neural Networks – the data science blog【译】神经网络的直观解释 – HackCV如何理解卷积神经网络(An Intuitive Explanation of Convolutional Neural Networks)3D Visualization of a Convolutional Neural Network2D Visualization of a Conv...原创 2022-05-17 10:06:03 · 250 阅读 · 0 评论 -
深度学习之梯度下降与优化
参考简单认识Adam优化器 - 知乎三种梯度下降算法的比较和几种优化算法 - 知乎pytorch学习系列(4):常用优化算法_ch ur h的博客-CSDN博客一、问题的提出大多数机器学习或者深度学习算法都涉及某种形式的优化。 优化指的是改变 以最小化或最大化某个函数 的任务。 我们通常以最小化 指代大多数最优化问题。我们把要最小化或最大化的函数称为目标函数或准则。 当我们对其进行最小化时,我们也把它称为代价函数、损失函数或误差函数。下面,我们假设一个损失函数为其中 ...原创 2022-05-09 16:25:27 · 3061 阅读 · 2 评论 -
深度学习之激活函数
转自[深度学习中常用激活函数总结 - 知乎]0. 前言本文总结了几个在深度学习中比较常用的激活函数:Sigmoid、ReLU、LeakyReLU以及Tanh,从激活函数的表达式、导数推导以及简单的编程实现来说明。1. Sigmoid激活函数Sigmoid激活函数表达式Sigmoid导数表达式Sigmoid编程实现Sigmoid激活函数以及导函数图像Sigmoid激活函数也叫做Logistic函数,因为它是线性回归转换为Logistic(逻辑回归)的核心函数,这转载 2022-05-07 15:48:32 · 1808 阅读 · 0 评论 -
深度学习之损失函数
损失函数1、什么是损失函数?一言以蔽之,损失函数(loss function)就是用来度量模型的预测值f(x)与真实值Y的差异程度的运算函数,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。-损失函数:用于衡量'单个样本点'预测值与实际值的偏离程度。-风险函数:用于衡量'样本点平均意义'下的好坏,就是说要除以batch_..原创 2022-05-07 15:38:58 · 12492 阅读 · 0 评论 -
Tensorflow (8) 图解 A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention
Neural Machine Translation (seq2seq) Tutorial.(练习)Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention) – Jay Alammar – Visualizing machine learning one concept at a time.基于Attention的机器翻译模型,中文翻译不全Sequence-to-seq.翻译 2022-04-13 11:32:09 · 188 阅读 · 0 评论 -
Tensorflow (7) 图解 NumPy
1、Creating Arrays2、Array Arithmeticdata * 1.6:3、Indexing4、Aggregationmin, max, and sum, plenty of others.5、Creating Matricesnp.array([[1,2],[3,4]])6、Matrix Arithmetic7、Dot Productmatrix mult...原创 2022-04-12 17:31:15 · 1675 阅读 · 0 评论 -
Tensorflow (5) Word2Vec
一般,我们会使用One-Hot编码(使用n个值的向量)来表示神经网络的输入。例如,使用神经网络对动物分类: < Bird, Cat, Dog, Fish >,Bird的One-Hot编码是<1,0,0,0> 。但是这样的编码会有一些问题。当类别很大时,使用One-Hot编码会使用大量的空间存储没有多少含义的0。除此之外,这种编码,损失了位置信息,没法表达不同单词之间的关联信息。比如在这里Cat和Dog之余Fish含义是一样的,但是实际上Cat与Fish之间的关联应该更大些。原创 2022-04-11 16:30:05 · 1887 阅读 · 0 评论 -
Tensorflow (6) Attention 注意力机制
细讲 | Attention Is All You Need关于注意力机制(《Attention is all you need》)一步步解析Attention is All You Need! - 简书(代码)The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time.The Illustrated Transformer【译】Visualizing A .原创 2022-04-11 10:07:37 · 3577 阅读 · 0 评论 -
Tensorflow (0) 安装
Tensorflow原创 2022-03-22 15:05:42 · 2709 阅读 · 0 评论 -
深度学习之学习(1-3)Bag of Features (BOF)图像检索算法
一、原理参考:BOF——Bag-of-Featrures图像可以视为一种文档对象,图像中不同的局部区域或其特征可看做构成图像的词汇,其中相近的区域或其特征可以视作为一个词。这样,就能够把文本检索及分类的方法用到图像分类及检索中去。 Bag-of-Features模型仿照文本检索领域的Bag-of-Words方法,把每幅图像描述为一个局部区域/关键点(Patches/KeyPoints)特征的无序集合。使用某种聚类算法(如K-means)将局部特征进行聚类,每个聚类中心被看作是词典中...原创 2022-03-18 10:55:46 · 2859 阅读 · 0 评论 -
基于视觉的机器人抓取【转】2020
转自【https://georgedu.github.io/docs/201106-Vision-based-Robotic-Grasping-GuoguangDu.pdf(slide)】论文:https://arxiv.org/abs/1905.06658...原创 2022-03-17 15:09:47 · 690 阅读 · 0 评论 -
机器人学习(课程)
CS391R: Robot LearningDate Topic Presenters Notes Week 1 Thu, Aug 27 LectureIntroduction: Towards General-Purpose Robot Autonomy Building Machines That Learn and Think Like People. Brenden M. Lake, Tomer D. Ullman, Joshua B. Ten.转载 2022-03-17 14:27:07 · 703 阅读 · 0 评论 -
深度学习之YOLOv5实践应用(5-1)WEB端部署(Flask+VUE)
源码参见:Yolov5-Flask-VUE:在WEB端部署YOLOv5目标检测模型-源码一、Flask参见 :安装 — Flask 0.10.1 文档1、sudo apt-get install python3-pip2、sudo pip3 install Flask原创 2022-03-11 12:47:36 · 5482 阅读 · 1 评论 -
深度学习之YOLOv5实践应用(3-1)人头检测模型
参考:基于yolov5训练人头检测模型 - 知乎一、数据集下载地址:链接:四、模型训练1. 数据集目录配置在data文件夹下创建head.yaml,此文件设置类别数量,类别名称以及数据集的路径。内容如下图所示:head.yaml2. 预训练模型从 yolov5 github 源码地址下载预训练 yolov5s.pt、yolov5m.pt、yolov5l.pt、yolov5x.pt放置在 weights目录下,训练前需要修改models目录下yolov5.ya原创 2022-03-10 10:36:05 · 14106 阅读 · 16 评论 -
深度学习之YOLOv5实践应用(2)数据集制作与训练
一、安装labelImg安装labelImg(Ubuntu / Linux)Ubuntu 18.04 Linux安装labelImg的教程# 将源码下载到本地git clonehttps://github.com/tzutalin/labelImg.git# 切换进入项目代码cd labelImg# 开辟一个新的anaconda环境,命名为yoloconda create -n yolo# 进入yolo环境conda activate yolo# 安装基础py..原创 2022-03-09 14:58:06 · 1336 阅读 · 1 评论 -
深度学习之YOLOv5实践应用(1)系统安装配置
【动手学深度学习(一)】Yolov5环境配置教程 - 知乎(ubuntu)[译] 再看 Flask 视频流 - 知乎使用YOLOv5实现多路摄像头实时目标检测yolov5检测视频流的原理、detect.py解读yolov5检测视频流的原理、detect.py解读vue+flask实现视频目标检测yolov5Flask部署YOLOv5 - 知乎【Yolov5】训练自己的yolov5模型并集成到安卓应用中【上】在WEB端部署YOLOv5目标检测(Flask+VUE)实用教程详...原创 2022-03-09 11:21:03 · 3809 阅读 · 0 评论 -
深度学习之学习(3-5)YOLOV5
五、YOLOv55.1 简介YOLOv5是一个在COCO数据集上预训练的物体检测架构和模型系列,它代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使得其速度与精度都得到了极大的性能提升,具体包括:输入端的Mosaic数据增强、自适应锚框计算、自适应图片缩放操作;基准端的Focus结构与CSP结构;Neck端的SPP与FPN+PAN结构;原创 2022-03-08 15:53:02 · 16287 阅读 · 1 评论 -
深度学习之学习(3-4)YOLOV4
四、大神接棒:YOLOv44.1 简介今年(2020年)YOLO系列的作者Redmon在推特上发表声明,出于道德方面的考虑,从此退出CV界。听到此消息的我,为之震惊!本以为YOLOv3已经是YOLO系列的终局之战。没想到就在今年,Alexey Bochkovskiy等人与Redmon取得联系,正式将他们的研究命名为YOLOv4。YOLOv4对深度学习中一些常用Tricks进行了大量的测试,最终选择了这些有用的Tricks:WRC、CSP、CmBN、SAT、 Mish activation、Mos原创 2022-03-08 15:23:51 · 3846 阅读 · 0 评论 -
深度学习之学习(3-4)YOLOV3
三、巅峰之作:YOLOv33.1 简介2018年,作者 Redmon 又在 YOLOv2 的基础上做了一些改进。特征提取部分采用darknet-53网络结构代替原来的darknet-19,利用特征金字塔网络结构实现了多尺度检测,分类方法使用逻辑回归代替了softmax,在兼顾实时性的同时保证了目标检测的准确性。从YOLOv1到YOLOv3,每一代性能的提升都与backbone(骨干网络)的改进密切相关。在YOLOv3中,作者不仅提供了darknet-53,还提供了轻量级的tiny-darknet原创 2022-03-07 16:42:02 · 3627 阅读 · 1 评论 -
深度学习之学习(3-3)YOLOV2
参见:【目标检测论文阅读】YOLOv2 - 知乎二、更快更准:YOLOv22.1 简介2017年,作者 Joseph Redmon 和 Ali Farhadi 在 YOLOv1 的基础上,进行了大量改进,提出了 YOLOv2 和 YOLO9000。重点解决YOLOv1召回率和定位精度方面的不足。YOLOv2 是一个先进的目标检测算法,比其它的检测器检测速度更快。除此之外,该网络可以适应多种尺寸的图片输入,并且能在检测精度和速度之间进行很好的权衡。相比于YOLOv1是利用全连接层直接预测B转载 2022-03-07 15:24:14 · 3346 阅读 · 0 评论 -
深度学习之学习(2-1)Faster R-CNN 学习0
Faster R-CNN一、整体架构 二、网络结构 2.1、Conv layers 2.2 RPN(Region Proposal Networks) 2.3 Anchors的生成规则 2.4 边界框回归原理与实现方法 2.5 损失函数 2.5.1 Fast R-CNN 2.5.2 Faster R-CNN损失函数 softmax 三 RPN训练 3.1 采样 3.2 初始化 3.3 参数化设置(使用caffe实现) 3.4 训练 四 参原创 2022-03-04 17:26:29 · 579 阅读 · 0 评论 -
深度学习之学习(1-2)感受野(receptive field)
参见:原始图片中的ROI如何映射到到feature map? - 知乎1感受野的概念 在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。2、感受野的计算感受野计算时有下面的几个情况需要说明: (1)第一层卷积层的输出特征图像素的感受野的大小等于滤波器的大小 (2)深层卷积层的感受野大小和它之前所有层的滤波器大小和步长有关系 (3)计算感受野大小时,忽略了图像边缘的影响,即不考虑padd.原创 2022-03-04 14:46:46 · 1789 阅读 · 0 评论 -
深度学习之学习(1-1) VGG16网络结构详解
参见【深度学习】全面理解VGG16模型_florrie-CSDN博客_vgg16模型介绍 深度学习-VGG16原理详解_é£的博客-CSDN博客_vgg161、网络结构根据卷积核大小和卷积层数,VGG共有6中配置,分别为A,A-LRN,B,C,D,E,其中D和E两种最为常用,即i我们所说的VGG16和VGG19。具体为:1. 卷积-卷积-池化-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-卷积-卷积-卷积-池化-全连接-全连接-全连接 。2. 通道数.原创 2022-03-04 11:24:38 · 55983 阅读 · 4 评论 -
Faster R-CNN 学习
重新阅读Faster R-CNN一、整体架构二、网络结构2.1、Conv layers2.2 RPN(Region Proposal Networks)2.3 Anchors的生成规则2.4 边界框回归原理与实现方法2.5 损失函数2.5.1 Fast R-CNN2.5.2 Faster R-CNN损失函数softmax三 RPN训练3.1 采样3.2 初始化3.3 参数化设置(使用caffe实现)3.4 训练四 参考一、整体架构参考https://www.cnblogs.com/wangyong/p原创 2022-03-04 10:03:44 · 560 阅读 · 0 评论 -
MASK RCNN 学习链接汇总
Mask R-CNN 知乎 Mask RCNN__Mask RCNN详细流程解析 MASK RCNN 源码阅读(UPDATE) Mask RCNN 学习笔记(结构分析) 先理解Mask R-CNN的工作原理,然后构建颜色填充器应用(实例验证) mask rcnn训练自己的数据集 实例分割算法 - Mask-RCNN (FCN Mask详细介绍) 令人拍案称奇的Mask RCNN 重点ROI Align Mask RCNN+机器人6D抓取爬坑小结(一) ...原创 2022-03-04 10:01:38 · 239 阅读 · 0 评论 -
[转]Object Detection and Classification using R-CNNs
https://www.telesens.co/2018/03/11/object-detection-and-classification-using-r-cnns/In this post, I’ll describe in detail howR-CNN (Regions with CNN features), a recently introduced deep learning based object detection and classification method works. R.转载 2020-08-20 14:06:51 · 311 阅读 · 1 评论 -
TensorRT [只有链接]
TensorRT部署深度学习模型 - 知乎 [深度学习] TensorRT安装原创 2020-07-10 17:21:40 · 123 阅读 · 0 评论 -
基于Tensorflow和Opencv的行人检测
本文主要记录在Tensorflow和Opencv环境下实现行人检测的主要步骤,特别是一些常用命令和需要用到的脚本文件,生成的模型文件等。文章主要分为以下几个部分:环境搭建、数据集生成制作、Tensoflow训练、导出模型在Opencv中实现行人检测。目录一、环境搭建... 21.1 tensorflow.. 21.2 opencv. 21.3下载opencv4.1.1源码... 31.4下载安装protoc. 31.5安装Tensorflow object_detectio.转载 2020-07-02 10:06:14 · 2001 阅读 · 3 评论 -
OPEN DNN Tensorflow ROS
Opencv DNNOpenCV DNN github Deep Neural Networks (dnn module)(opencv dnn 教程) TensorFlow Object Detection API ROS工程不使用ROS自带的OpenCV TensorflowTensorflow C++ 编译和调用图模型( 有图) Tensorflow detection model zoo ...原创 2020-06-30 13:53:50 · 242 阅读 · 0 评论 -
机器人行人识别与跟随 (OPENCV DNN Tensorflow ROS)(只有链接)
OpenPose 基于OpenCV DNN 的多人姿态估计基于OpenCV使用OpenPose进行多个人体姿态估计Opencv之HOG特征与SVM相结合的人体检测行人检测 基于 OpenCV 的人体检测基于opencv的行人检测(支持图片,视频)opencv︱opencv中实现行人检测:HOG+SVM(二)Tensorflow+OpenCV实战行人检测(笔记)基于Tensorflow和Opencv的行人检测 细致行人检测--OpenCV与TensorFlow SSD对比...原创 2020-06-18 15:36:30 · 3039 阅读 · 0 评论 -
3D目标检测论文汇总
https://zhuanlan.zhihu.com/p/97397273一、单目图像下的3D目标检测1、YOLO3D2、SSD-6D3、3D Bounding Box Estimation Using Deep Learning and Geometry4、GS3D:An Effcient 3D Object Detection Framework for Autonomou...转载 2020-04-15 17:05:33 · 3750 阅读 · 0 评论 -
基于深度学习目标姿态估计的论文一览
https://zhuanlan.zhihu.com/p/108381101论文只选了那些单目图像的深度学习方法,上部主要是半年以前的论文。•PoseCNN: A CNN for 6D ObjectPoseEstimation in Cluttered Scenes (RSS 2017)估计已知目标的6D姿势对于机器人与现实世界进行交互非常重要。由于目标的种类繁多以及目标之间的干扰...转载 2020-04-15 14:18:11 · 3121 阅读 · 0 评论 -
深度学习在三维环境重建中的应用 SLAM
https://zhuanlan.zhihu.com/p/112103579最经典的计算机视觉问题是3-D重建。基本上可以分成两种路径:一是多视角重建,二是运动重建。前者有一个经典的方法是多视角立体视觉(MVS,multiple view stereo),就是多帧的立体匹配,这样采用CNN模型来解决也合理。传统MVS的方法可以分成两种:区域增长(region growing)和深度融合(dep...转载 2020-04-15 11:25:35 · 2236 阅读 · 0 评论 -
人体姿态估计的过去,现在,未来(转发)
人体姿态估计的过去,现在,未来https://zhuanlan.zhihu.com/p/85506259前言因为在ICIP2019上面和两位老师搞了一个关于人体姿态估计以及动作行为的tutorial,所以最近整理了蛮多人体姿态估计方面的文章。所以做了一个总结和梳理,希望能抛砖引玉。问题人体姿态估计是计算机视觉中一个很基础的问题。从名字的角度来看,可以理解为对“人体”的姿态(关键...转载 2020-04-15 11:24:03 · 615 阅读 · 0 评论 -
3D目标检测框架VoteNet
3D目标检测框架VoteNet参考https://blog.csdn.net/wqwqqwqw1231/article/details/101283243 Charles R. Qi,Or Litany,何恺明,Leonidas J. Guibas等当前主流的3D目标检测方法,很大层度上受2D检测器的影响。充分利用2D检测器提取3D建议框,或将3D点云转换为规则的网格或利用2D图...转载 2020-04-15 09:40:28 · 798 阅读 · 0 评论 -
3D 目标检测
参考: 3D检测入门知识梳理原创 2020-04-15 14:55:39 · 8076 阅读 · 0 评论 -
机器学习与深度学习相关书籍
MLAPP笔记Machine LearningA Probabilistic Perspective Kevin P. Murphy The Elements of Statistical Learning 中文翻译网址(这里) 机器学习书籍选择? 学习机器学习应该看哪些书籍? ...原创 2020-04-01 09:59:14 · 222 阅读 · 0 评论 -
基于深度学习的2D图像目标检测
参见第一部分网址1,第二部分网址2一、如何计算一个图像的HOG特征维数呢?Dalal提出的Hog特征提取的过程:把样本图像分割为若干个像素的单元(cell),把梯度方向平均划分为9个区间(bin),在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个9维的特征向量,每相邻的4个单元构成一个块(block),把一个块内的特征向量联起来得到36维的特征向量...原创 2020-03-31 17:14:49 · 4372 阅读 · 0 评论