深度学习
文章平均质量分 90
持久决心
主攻深度学习&机器视觉领域,希望与各个领域的大佬交流. [Github:https://github.com/PingHGao] [Stack Overflow:https://stackoverflow.com/users/7371707/toughmind ] [CSDN:https://blog.csdn.net/u013832707] [Yuque:https://www.yuque.com/toughmind] [Email:gphsmail@163.com]
展开
-
NVIDIA A100 深度解密(一):GPU 峰值计算那些事
这是我的推广信息,以激励自己更好的分享自己的知识和经验!也希望看到的你能够多多支持,谢谢!1. 滴滴云AI大师:目前滴滴云正在大力推广自己的云计算服务,需要购买的朋友们用我的AI大师码 「2049」在滴滴云上购买 GPU / vGPU / 机器学习产品可额外享受 9 折优惠,点击这里前往滴滴云官网。1、背景介绍2020 年 5 月 14日,NVIDIA 创始人兼首席执行官黄仁勋在自家厨房直播带货,哦不对应该是 NVIDIA GTC 2020 主题演讲中热情洋溢地介绍了新鲜出炉的基于最新 Ampe.转载 2020-09-16 21:20:00 · 8815 阅读 · 1 评论 -
使用合成数据改善机器学习中的极度不平衡数据集
这是我的推广信息,以激励自己更好的分享自己的知识和经验!也希望看到的你能够多多支持,谢谢!1. 滴滴云AI大师:目前滴滴云正在大力推广自己的云计算服务,需要购买的朋友们用我的AI大师码 「2049」在滴滴云上购买 GPU / vGPU / 机器学习产品可额外享受 9 折优惠,点击这里前往滴滴云官网。原文地址:Improving massively imbalanced datasets in machine learning with synthetic data原文作者:Alexander.原创 2020-09-15 15:39:34 · 994 阅读 · 1 评论 -
如何表示MASK
这是我的推广信息,以激励自己更好的分享自己的知识和经验!也希望看到的你能够多多支持,谢谢!1. 滴滴云AI大师:目前滴滴云正在大力推广自己的云计算服务,需要购买的朋友们用我的AI大师码 「2049」在滴滴云上购买 GPU / vGPU / 机器学习产品可额外享受 9 折优惠,点击这里前往滴滴云官网。MASK 是如何表示的?在计算机视觉领域,mask 是一个常常涉及的知识。如下图所示,它常用来表示物体在图像中所对应的区域。一般一个 mask 对应的是一个二维二进制数组。那么它还有其他的表示方法吗?.原创 2020-09-14 19:41:05 · 967 阅读 · 0 评论 -
2D目标检测模型表现总览
总结2D目标检测模型的性能,对层出不穷的算法有一个直观的印象。原创 2020-08-09 17:32:00 · 404 阅读 · 0 评论 -
FLIR Thermal Starter 数据集详解
简介该数据集提供了带注释的热成像数据集和对应的无注释RGB图像,用于训练和验证神经网络。数据是由安装在车上的RGB相机和热成像相机获取的。数据集总共包含14452张红外图像,其中10228张来自多个短视频;4224张来自一个长为144s的视频。所有视频都来自街道和高速路。大多数图片的采样率为1秒两帧,其中视频的帧率为1秒30帧;少数环境中目标较少时,采样率为1秒1帧。使用MSCOCO labelvector进行标注。具体如下:类别 1:People类别 2:Bicycle —— 自行车和摩托车(原创 2020-05-09 11:13:43 · 10614 阅读 · 6 评论 -
【转载】选择性搜索算法介绍——Selective Search
RCNN中提出了SS算法用于初步产生2k左右的候选框,最开始觉得这个算法很普通,和滑动窗口这类的笨方法一样。然而现在发现并不是这样,这个方法很精巧,其中包含的图像相似度计算似乎还能用到其他地方。这一切的一切都是因为博主大奥特曼打小怪兽的博客第三十三节,目标检测之选择性搜索-Selective Search。这篇博客写得很好,于是乎转载记录一下。SS简介传统的目标检测算法大多数以图像识别为基础。...转载 2019-12-19 17:35:28 · 1252 阅读 · 0 评论 -
斯坦福深度学习课程cs231n assignment2作业笔记五:Batch Normalization(以及Layer Normalization)
介绍一般来说,让网络更易于训练有两种方式。一种是采用更加精巧的优化方法,如SGD+momentum, RMSProp, or Adam。另一种方法是改变网络的结构,使其更加易于训练。Batch Normalization就是这样一种方法。这一方法很直接。一般来说,机器学习方法在中心为0,标准差为1的输入数据上会表现得更好。在训练网络时,我们通过预处理,可以使得输入数据符合这一特征。然而,更深层...原创 2018-10-12 11:57:09 · 3823 阅读 · 3 评论 -
斯坦福深度学习课程cs231n assignment2作业笔记六:Dropout相关
前言Dropout是在训练过程中随机使神经网络的一些神经元冻结以提升网络表现的技巧。本次作用就会实现这一简单的方法。具体原理参考http://cs231n.github.io/neural-networks-2/#reg代码实现def dropout_forward(x, dropout_param): """ Performs the forward pass for (...原创 2018-10-14 09:58:21 · 678 阅读 · 0 评论 -
斯坦福深度学习课程cs231n assignment2作业笔记六:Convolutional Networks
话不多说,直接上代码:Convolution: Naive forward passdef conv_forward_naive(x, w, b, conv_param): """ A naive implementation of the forward pass for a convolutional layer. The input consists of N ...原创 2018-10-15 15:29:10 · 2665 阅读 · 0 评论 -
斯坦福深度学习课程cs231n assignment1作业笔记三:softmax实现相关
任务实现向量化的损失函数实现向量化的梯度计算分析梯度与数值梯度的验证使用验证集来选择超参数使用SGD优化方法可视化权重理论知识softmax损失函数令W为权重矩阵,大小为D×C;x为输入,大小为1×D;b为偏置项,大小为1×C。那么模型的输出为:XW + b为一个向量S(1×C),对应样本属于各个类别的得分。在实际实现中偏置b被放入了W中,只需要在输入X后面多加一个1即可...原创 2018-10-09 09:53:41 · 949 阅读 · 0 评论 -
NLP学习之使用pytorch搭建textCNN模型进行中文文本分类
最近花周末两天时间利用pytorch实现了TextCNN进行了中文文本分类,在此进行记录。数据获取中文数据是从https://github.com/brightmart/nlp_chinese_corpus下载的。具体是第3个,百科问答Json版,因为感觉大小适中,适合用来学习。下载下来得到两个文件:baike_qa_train.json和baike_qa_valid.json。内容如下:{...原创 2019-03-18 10:53:48 · 34332 阅读 · 69 评论 -
史上最强!目标检测数据集标注工具网页版
前言相信做目标检测的大家都有过会在将会有制作自己的目标检测数据集的需求。标注数据就得有相应的工具,这里就提供了这样一个标注工具。这个标注工具有着独一无二的特点,它是基于浏览器的标注工具。这就意味着任何一台安装有浏览器(目前只在Chrome浏览器成功测试)的电脑都可以进行图像标注,不需要安装任何额外的软件或者插件!我把它取名为LabelWebLabelWeb的界面如下目前只预留了十个类别...原创 2019-05-26 11:51:51 · 8383 阅读 · 4 评论 -
MS COCO数据集详解
一、一些网址数据集官网首页:http://cocodataset.org/#home数据集下载:可用迅雷去下载官方链接,速度还是挺快的。如果速度不快,可能你需要找“正确版本”的迅雷也可以去这个高中生搭建的下载站下载:http://bendfunction.f3322.net:666/share/。 他的首页是这样子的:http://bendfunction.f3322.net:666...原创 2019-06-26 10:10:58 · 42191 阅读 · 2 评论 -
pycocotools使用教程,基础版
导入相关的包from pycocotools.coco import COCOimport matplotlib.pyplot as pltimport cv2import osimport numpy as npimport random定义一些变量cocoRoot = "/media/gph/D(Data)/COCO/"dataType = "val2017"ann...原创 2019-07-02 15:19:48 · 26027 阅读 · 7 评论 -
[翻译]Caffe2 + PyTorch = PyTorch 1.0 作者:贾扬清
pytorch1.0是pytorch和caffe2合并的结果,这到底意味着什么,贾扬清本人给出了答案。原文请参考:Caffe2 + PyTorch = PyTorch 1.0正式宣告PyTorch1.0同时胜任与研究和生产场景将AI开发从研究带向生产的道路一直需要很多步骤和工具,让新的方法的测试、部署以及迭代优化等操作常耗时和复杂。为了加速和优化这一过程,我们引入了PyTorch1.0,我们的...翻译 2019-09-11 10:32:53 · 849 阅读 · 0 评论 -
斯坦福深度学习课程cs231n assignment1作业笔记二:SVM实现相关
前言在学习cs231n课程,完成作业的过程中,博主遇到了一些问题,于是打算写博客记录下来。代码实现距离计算我们拥有测试数据X,训练数据self.X_train。它们的形状都是R×3072。距离公式采用的是Euclidean distance,如下:双循环代码for i in tqdm(range(num_test)): for j in range(num_train):...原创 2018-09-27 09:27:35 · 807 阅读 · 0 评论 -
斯坦福深度学习课程cs231n assignment2作业笔记四:Fully-Connected Neural Nets
在有引导的情况下,发现具体实现和相关原理并不难。可是在学习这个课程之前,这些知识点对于博主来说都是不想去理解的理论知识,更没想过手动实现。不得不说,大牛的课程就是牛啊。跟着走了一遍之后,以前感觉底层的东西都理解的很透彻。本博客只贴出代码,给大家自己编写时有一个参考。不会去详细解释原理作业内容以更加模块化的方式实现全连接神经网络,主要包括:实现诸如affine,relu等等层的前向计算以及...原创 2018-10-11 18:14:39 · 2520 阅读 · 0 评论 -
SegNet安装运行
SegNet是英国剑桥大学Computer Vision and Robotics Group的作品;是一个深度卷积编码-解码结构,用于对图像进行像素级的语义分割;可以将像素分为12类,包括道路、建筑物、电线杆、路牌、行人和骑行者等12类标注,具有实时性;其源代码在 github上。安装:和安装caffe一样,注意将WITH_PYTHON_LAYER := 1前面的注释去掉原创 2016-12-15 21:32:52 · 18225 阅读 · 25 评论 -
Faster RCNN详解:从region proposal到bounding box回归
转载自Faster RCNN解析 。 网上很多关于Faster RCNN的介绍,不过这一片算是比较全的了,不仅包括整体流程、思想的介绍,也包括各个实现较为深入的介绍。大概内容记录如下(仅记录目前我感兴趣的部分),详情参看原文。转载 2016-12-14 16:07:47 · 43625 阅读 · 9 评论 -
Faster R-CNN安装运行
安装运行faster RCNN, 解决ImportError: libcudart.so.6.5: cannot open shared object file: No such file or directory;Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Python等等问题原创 2016-12-07 10:04:45 · 8704 阅读 · 5 评论 -
YOLO:You Only Look Once运行记录(Ubuntu14.04+GT750M)
YOLO是自己实现的框架darknet,并不是基于caffe,虽然Github上有基于caffe的实现。YOLO的编译很快,tinyYOLO的速度确实也非常高,不过准确度是真的低。记录一下YOLO利用摄像头获取图像并进行目标检测的过程以及遇到的错误:/bin/sh: 1: nvcc: not foundmake: *** [obj/convolutional_kernels.o] Error 127原创 2016-12-02 20:02:27 · 4218 阅读 · 0 评论 -
什么是深度学习?
这里分享一篇大牛写的有关深度学习的基础知识的博客:Deep Learning(深度学习)学习笔记整理系列,我的很大一部分理解参考了这篇博客。一下记录一下个人的总结。据目前的所了解,深度学习的实质就是深层的神经网络,它是基于神经网络发展而来的。典型的神经网络结构是由多层组成,每层神经元与下层网络全互联,神经元之间不存在同层连接,也不存在跨层连接。这样的神经网络结构通常称为“多层前馈神经网络”。原创 2016-12-29 10:45:41 · 26442 阅读 · 2 评论 -
CNN经典网络模型摘要--AlexNet、ZFnet、GoogleNet、VGG、ResNet
本文转载自CNN经典网络模型摘要–AlexNet、ZFnet、GoogleNet、VGG、ResNet. CNN的经典结构始于1998年的LeNet,成于2012年历史性的AlexNet,从此大盛于图像相关领域,主要包括: 1、LeNet,1998年 2、AlexNet,2012年 3、ZF-net,2013年 4、GoogleNet,2014年 5、VGG,2014转载 2017-03-22 10:25:25 · 4743 阅读 · 1 评论 -
各种优化方法的介绍
梯度下降算法是最受欢迎的优化方法之一,同时也是最常用的神经网络优化算法。与此同时,现在各种最新的深度学习框架包含了各种各样梯度下降优化算法的实现(比如lasagne、caffe、keras的实现)。然而,这些算法经常被作为一个黑盒子进行使用,实用的关于它们的优缺点的解释却是很难找到的。本文旨在为大家介绍各种优化算法以帮助大家更好的使用这些算法。我们首先介绍梯度下降方法的不同变种;然后简要总结一下训练过程中会遇到的转载 2017-07-29 18:06:31 · 3554 阅读 · 0 评论 -
卷积神经网络(CNN)理论学习之经典BP算法
简介卷积神经网络(Convolutional Neural Network)的结构类似于神经网络,可以看做是对其的改进。它利用局部连接、权值共享、多核卷积、池化四个手段大大降低了参数的数目,使得网络的层数可以变得更深,并且能够合理的隐式的提取特征。CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于其特征检测层通过训练数据进行学习,隐式地从训练数据中进行学习,避免了显式的特征抽取;再者由原创 2016-12-26 14:57:28 · 13448 阅读 · 0 评论 -
Caffe SSD 配置安装
在Ubuntu14.04下运行SSD的ssd_pascal_webcam.py,解决了很多错误,关键词如下:1.error: ‘type name’ declared as function returning an array escape 2.cudaSuccess (8 vs. 0) invalid device function 3.Cannot copy param 0 weights from 等等原创 2016-12-01 22:27:00 · 9885 阅读 · 4 评论 -
Pascal Voc数据集详细分析
前言做深度学习目标检测方面的同学怎么都会接触到PASCAL VOC这个数据集。也许很少用到整个数据集,但是一般都会按照它的格式准备自己的数据集。所以这里就来详细的记录一下PASCAL VOC的格式,包括目录构成以及各个文件夹的内容格式,方便以后自己按照VOC的标准格式制作自己的数据集。正文相关网址Pascal VOC网址:http://host.robots.ox.ac.u...原创 2018-04-24 13:58:29 · 84860 阅读 · 10 评论 -
Ubuntu16.04安装pytorch(pip)
Ubuntu16.04安装pytorch原创 2018-04-25 12:03:54 · 18310 阅读 · 1 评论 -
YOLOV3的pytorch实现
源代码作者官方链接https://github.com/ayooshkathuria/pytorch-yolo-v3运行这个版本只实现了预测,并不能训练。同时运行十分简单,只需要你符合一定的条件。直接运行需要你满足一下条件Python3.5OpencvPytorch0.3或者0.4 如果你满足这些条件,并且在根目录下放进去yolov3.weight,执行命令...原创 2018-04-25 18:03:23 · 9473 阅读 · 4 评论 -
初始化你的pytorch模型
相关资料在设计好卷积神经网络模型后,面临的第一个问题就是如何进行初始化。如此博主查阅了一些资料,如下: 关于weight initialization的讨论 以及在该讨论下一些答主给出的例子: https://github.com/pytorch/examples/blob/master/dcgan/main.py#L90-L96 https://github.com/pytorch/...原创 2018-06-05 17:42:52 · 7415 阅读 · 1 评论 -
VSCODE使用打开ipynb文件的问题
VSCODE使用打开ipynb文件的问题前言环境插件安装问题已经安装了python和jupyter,但是就是报错右键打开没有显示前言jupyter可以一段一段的运行python代码并且保存中间结果,用着十分方便。结合vscode更是舒服。博主在vscode下打开ipynb文件遇到了一些问题,特此记录环境vscode:1.27.2python:3.5jupyter:4.4.0插件安装...原创 2018-09-24 11:47:43 · 36121 阅读 · 6 评论 -
PoseNet简介及运行
PoseNet简介PoseNet是剑桥大学做的一个视觉定位模型,能够通过一张彩色图像定位你的位姿信息。在一个大的城市环境下,它只需要花费5ms来获取你的位姿信息,精度比GPS更高。并且相较于GPS,它能够确定你的方向且能够在室内运行。我们将卷积神经网络应用于相机的姿态回归中。因为我们训练了一个端到端的网络用于计算相机的位姿,所以我们的系统十分简单。与其他的系统不同,我们的不需要一个大的数据原创 2016-12-18 11:10:11 · 18476 阅读 · 9 评论