深度学习与计算机视觉
cherry_yu08
菜鸟
展开
-
RuntimeError: Expected object of backend CPU but got backend CUDA for argument #4 'mat1'
根据错误提示找到问题处在F.linear(input, self.weight, self.bias)这里,参数input是在cuda里面的,进入linear.py,在参数self.weight, self.bias后面的赋值语句后面加上.cuda(0),即torch.Tensor(…).cuda(0),问题解决...原创 2019-12-17 01:09:03 · 3535 阅读 · 1 评论 -
手势识别相关资料
1、姿态估计(Hand Pose Estimation)相关总结2、手势估计- Hand Pose Estimation3、手势数据集原创 2018-08-01 17:24:33 · 559 阅读 · 1 评论 -
关于图片篡改检测、图像取证的相关资料
1、对图像取证技术的总结 “谁动了我的图片?” – 图像取证技术 主动的:加水印等 图像取证不添加额外信息,属于被动的检测技术。 2、介绍了一点成像技术 深度学习在图像取证领域中的进展 取证领域比较常用的网络结构为AlexNet,选择此网络结构的原因,是因为AlexNet网络结构相较于其他网络结构复杂度相对较低并且性能较好,对于解决数据集少的取证问题有更好的尝试性条件。 典型案例为L...原创 2018-07-30 20:54:40 · 9530 阅读 · 7 评论 -
Fully Convolutional Networks for Semantic Segmentation(FCN)论文笔记
1、解决什么问题基于卷积网络的语义分割,超过了语义分割state-of-the-art水平 使用全卷积网络,可以接受任意大小的输入,获得与输入同等大小的输出2、使用什么方法3、效果4、还存在什么问题...原创 2018-07-14 18:48:54 · 263 阅读 · 0 评论 -
YOLOv3论文笔记
YOLOv3是YOLO的改进版本,新的网络更大更准确,并且图片处理的速度依然很快。 项目代码1、解决什么问题多尺度预测 (类FPN) 更好的基础分类网络(类ResNet)和分类器2、使用什么方法bounding box预测 使用维度聚类(dimension cluster)作为anchor box来预测边界框(bounding box)。 每个边界框4个参数(...原创 2018-07-18 17:28:57 · 1923 阅读 · 0 评论 -
YOLO 论文笔记
YOLO全称You Only Look Once: Unified, Real-Time Object Detection,CVPR 2016的一片论文,paper的项目主页:http://pjreddie.com/darknet/yolo/。1、解决什么问题(1)将检测问题变为一个 regression problem,解决了classification-based和R-CNN的...原创 2018-07-17 16:43:05 · 1349 阅读 · 0 评论 -
keras中自定义验证集的性能评估
def AUC(y_true,y_pred): not_y_pred=np.logical_not(y_pred) y_int1=y_true*y_pred y_int0=np.logical_not(y_true)*not_y_pred TP=np.sum(y_pred*y_int1) FP=np.sum(y_pred)-TP TN=np.sum(not_y_pred*y...原创 2018-09-08 22:05:36 · 1514 阅读 · 0 评论 -
Pytorch安装
1、pytorch下载打开网站https://pytorch.org/,会自动根据电脑配置给出下载命令,我的是:conda install pytorch torchvision cudatoolkit=9.0 -c pytorch2、添加镜像由于网络问题,直接运行上面命令无法下载,出现http错误的问题,需要添加镜像。添加镜像后,在c:\Users\用户名 这个目录下生成.conda...原创 2019-02-26 16:05:19 · 387 阅读 · 0 评论 -
caffe安装
看了很多资料,编译仍有问题,还没找出问题在哪两个觉得比较靠谱的教程:1、https://blog.csdn.net/AkashaicRecorder/article/details/710169422、https://blog.csdn.net/zhj_matlab/article/details/69943869后来找到一个编译好的版本,直接放在site-packages下用了,目前没有...原创 2019-02-27 19:18:52 · 195 阅读 · 0 评论 -
python+opencv+dlib+Intel RealSense D435 实现人脸检测和跟踪
单张图片人脸检测视频序列人脸检测原创 2018-11-26 17:23:32 · 8374 阅读 · 6 评论 -
python opencv在图片上显示中文字符
cv2.putText() 不能显示英文字符参考这篇文章https://blog.csdn.net/dcrmg/article/details/79108491我这里的字体是百度下载的。img_OpenCV = cv2.imread('testpicc.jpg')# 图像从OpenCV格式转换成PIL格式img_PIL = Image.fromarray(cv2.cvtColor(im...原创 2018-10-31 21:43:25 · 14289 阅读 · 1 评论 -
Intel RealSense D435介绍、安装和使用
实验室采购的三个Intel RealSense相机到了,分别是D435、R200和blasterx senz3d,准备对每个相机写个使用笔记,了解主要功能。本篇是关于D435的使用笔记。一、产品介绍1、产品全称Intel RealSense Depth Camera D4352、实物图3、相机介绍参考博客2018年1月19日,英特尔宣布更新RealSense深度摄像头产品线,带...原创 2018-10-24 17:05:15 · 131425 阅读 · 61 评论 -
图像去雾相关资料
1、何凯明的论文《Single Image Haze Removal Using Dark Channel Prior》使用暗通道先验,根据光学模型公式推导出去雾公式,效果还不错。相关链接:基于暗通道先验的去雾算法问题是,这一做法很简单,效果也不错,相比于后来提出的使用深度学习的方法,效果好在哪里?...原创 2018-10-10 19:37:59 · 300 阅读 · 0 评论 -
OpenPose+win10安装
openpose在win10上的环境配置和安装,主要参考:https://blog.csdn.net/yuhijk2055/article/details/81637832另一篇博客后半部分有讲如何使用代码实现相应的功能:https://blog.csdn.net/lgh0824/article/details/75949477电脑配置比较渣,很容易出现以下错误,是内存问题:...原创 2018-09-26 15:08:49 · 13620 阅读 · 2 评论 -
VS2015+opencv3+opencv_contrib+dlib配置过程和问题记录
opencv3+opencv_contrib配置配置需要用到编译工具Cmake,详细过程网上比较全,参考了这个OpenCV 3.1.0 + opencv_contrib编译(Windows)编译过程如上文所示,VS的配置过程如下(这里包括opencv的配置和opencv_contrib的配置):(我的opencv_contrib目录跟上文不一样)1、配置包含目录在属性页,选择左侧配置属性...原创 2018-09-18 13:14:34 · 1120 阅读 · 3 评论 -
Convolutional Pose Machine总结
Convolutional Pose Machine总结目录Convolutional Pose Machine总结目录Convolutional Pose Machine简介算法详细分析算法流程(使用阶段而非训练阶段)创新点数据集效果展示相关资料博客githubConvolutional Pose Machine简介 Con...原创 2018-06-28 23:31:18 · 10750 阅读 · 3 评论 -
OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 论文笔记
1、解决什么问题使用一个卷积网络同时解决三个问题:分类、定位和检测(Recognition、Localization and Detection)。这个合成网络结构是ILSVRC3的winner。并且论文表明,训练一个卷积网络同时实现分类、定位和检测,可以同时提高这三类任务的准确率(定位的功能能够标出物体,将物体与背景分割开,这样有利于检测) 介绍了一种新颖的定位的检测方法:累加预测边框(...原创 2018-07-16 22:15:47 · 411 阅读 · 0 评论 -
残差网络实现手势识别
ng深度学习第四课第二周编程作业2,用keras框架残差网络(residual network)实现手势识别:import numpy as npfrom keras.layers import Input, Add, Dense, Activation, ZeroPadding2D, BatchNormalization, Flatten, Conv2D, AveragePooling2D, ...原创 2018-02-18 18:36:57 · 1148 阅读 · 0 评论 -
keras实现happyhouse程序
ng第四课第二周的作业,用keros实现happyhouse,即使用keras框架识别笑脸和非笑脸,代码如下。这个代码对训练集和测试集的准确率都挺高,但是对我自己输入的图片的识别效果确并不好,ng在作业中有指明原因:The training/test sets were quite similar; for example, all the pictures were taken against ...原创 2018-02-16 22:02:03 · 660 阅读 · 0 评论 -
tensorflow实现图像识别
学完了ng深度学习第四课,复习一遍代码。今天写第一周的作业---用tensorflow框架训练深层网络实现图像识别,代码写完后问题出来啦(问题已找出,用红色字体标出)ng的准确率:我的准确率:代价函数的初始值以及训练过程中的变化情况也很不一样,检查了代码是一样的。应该还是哪部分的代码出了问题,之前写别的代码也出现过类似的情况,当时是因为w的初始化公式不一样造成的。这里是什么问题暂时没检查出来,先放...原创 2018-02-16 18:15:07 · 11794 阅读 · 4 评论 -
关于pip install PIL报错
处理二维图片的时候from PIL import Image报错于是install PIL,抛出错误: Install packages failed: Installing packages: error occurred. 百度了下,网上说是因为PIL很久没更新了,现在都使用Pillow,且PIL包含在Pillow中。解决方法:安装Pillow,可以正常使用PIL。原创 2018-01-20 23:17:15 · 2856 阅读 · 0 评论 -
神经网络中参数的初始化方法
昨天做完了coursera上ng神经网络课程的第一节第四周作业,终于完整地实现了一个深层神经网络。当我准备整理一下思路和代码,写一个自己的神经网络时(其实就是copy代码),问题来了。我的代码的训练结果与课程作业中的结果差别很大:左边是作业中的结果,右边是我自己的结果,显然我的结果有问题。在梯度下降过程中,我的代价函数一直保持在0.6几,似乎陷入了局部最优解(不知道是不是这个原因),而在左...原创 2018-01-20 21:58:28 · 7253 阅读 · 3 评论 -
用Python实现路径分类
用Python实现路径分类目标 操场上有很多行人,从不同的入口进入,不同的路口出来,各自有不同的行走路径,现将这些行走轨迹分类,自行设计一个临界值,将相似的轨迹归为一类。1、程序流程图 2、算法原理①特征缩放 在本问题中,由于每条路径的起点不同、终点不同、路径长度不同,使用距离来计算相似度时会产生一定的误差,而采用特征缩放的方法,将坐标的值限定在(原创 2018-02-05 11:33:52 · 2524 阅读 · 3 评论 -
线性模型分析
线性模型分析摘要 线性模型是线性统计模型的一种简称,是数理统计学中研究变量之间关系的一种模型,在线性模型中,未知参数以线性形式出现。本文主要分析和介绍机器学习中两种经典的线性模型:线性回归模型的逻辑回归模型,并结合实际应用场景,用代码实现这两种模型的训练过程。1、线性模型的基本形式 线性模型形式简单,易于理解,是机器学习中非常基础的部分,许多复杂的非线性模型原创 2018-01-31 16:07:59 · 3243 阅读 · 0 评论 -
ng深度学习第一节代码总结:深层神经网络识别猫咪图片
之前在网易云课堂上看完了ng深度学习第一节课四周的内容,但是没有代码实践,总觉得学的很虚,于是去了coursera......这堂课的编程作业是从2层神经网络开始,过渡到n层的,我这里做了下整理,放出n层神经网络识别猫咪的代码:###多层神经网络实现图像识别import h5pyimport numpy as npimport matplotlib.pyplot as plt原创 2018-01-22 10:03:40 · 1203 阅读 · 0 评论 -
LeapMotion for python3 mac环境
开发环境mac、pycharm、python3.6安装步骤 在官网下载SDK后,把上图mac需要的几个文件复制到pycharm的虚拟环境目录(也可以放在一个目录中,在import leap之前引入该目录)中,但是此时只支持python2.7,要想用python3,需要自己生成LeapPython.so替换掉下载下来的LeapPython.so。 生成步骤: https://s...原创 2018-07-09 13:37:00 · 1298 阅读 · 8 评论 -
深度学习与计算机视觉系列(下)--目标检测&图像分割
深度学习与计算机视觉入门系列(下) 数据嗨客最近发布了一个深度学习系列,觉得还不错,主要对深度学习与计算机视觉相关内容做了系统的介绍,看了一遍,在这里做一下笔记。目录深度学习与计算机视觉入门系列(下)目录深度学习第8期:深度学习的常见框架深度学习第9期:强化学习的基本概念深度学习第10期:基于Q的强化学习(上)深度学习第11期:基于Policy的强化学习深度学习...原创 2018-06-30 16:38:22 · 12142 阅读 · 0 评论 -
深度学习与计算机视觉系列(中)--GAN
深度学习与计算机视觉入门系列(中) 数据嗨客最近发布了一个深度学习系列,觉得还不错,主要对深度学习与计算机视觉相关内容做了系统的介绍,看了一遍,在这里做一下笔记。目录深度学习与计算机视觉入门系列(中)目录深度学习第6期:循环神经网络RNN深度学习第7期:生成对抗网络GAN自回归类的方法,例如Pixel CNN等。自编码类的方法,例如VAE等;对抗生成模型(GAN...原创 2018-06-30 15:20:09 · 4187 阅读 · 0 评论 -
深度学习与计算机视觉系列(上)--Inception&Xception&ResNet
数据嗨客最近发布了一个深度学习系列,觉得还不错,看了一遍,在这里码一下。目录目录深度学习第1期:深度学习的历史与现状深度学习第2期:人工神经网络深度学习第3期:自编码器深度学习第4期:卷积神经网络深度学习第5期:CNN高级结构深度学习第1期:深度学习的历史与现状文中介绍了深度学习的发展史,对于理解神经网络的一些基础知识有帮助: 感...原创 2018-06-30 11:47:44 · 2333 阅读 · 0 评论 -
python三维数组变一维数组的原因
python三维数组(m,n,t)若有一个二维数组的大小不是(n,t)而是(x,t)时,打印数组的shape就会是(m, )表示一个一维数组原创 2018-03-05 16:45:17 · 3730 阅读 · 0 评论