- 博客(71)
- 资源 (12)
- 论坛 (3)
- 收藏
- 关注

原创 人脸检测 中那些 有启发意义的idea
人脸检测作为人脸识别的前置步骤,一直是研究的热点区域,在深度学习的浪潮下,涌现了一大批优秀的算法检测三问:SSD究竟在训练啥?anchor究竟有什么作用?anchror-based和anchor-free性能差距的根源在哪?只有深入理解了算法原理,才能够真正使用好算法,进而才有可能改进算法,必经之路就是研究论文和源码
2020-03-14 23:13:10
328

原创 姿态估计 最佳实践
基于OpenCV使用OpenPose进行多个人体姿态估计OpenPose:实时多人2D姿态估计 | 附视频测试及源码链接OpenPose训练自己的数据集模型OpenPose训练过程解析关键点估计之 PCK, PCKh, PDJ 评价度量论文解读Convolutional Pose Machine总结Cascaded Pyramid Network for Multi-P...
2018-09-04 21:54:23
1450

原创 深度学习 计算模型中每层参数的个数和FLOPs
FLOPS:全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。FLOPs:s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。对于普通卷积层来说:FLOPs=2HW(CinK^2+1)Cout
2018-05-17 11:13:56
3398

原创 opencv基于深度学习的人脸检测
opencv3.4 版之前自带的人脸检测器是基于Haar+Adaboost的,速度还可以,但是检出率很低,误检也很多,脸的角度稍大就检不出来,还经常会把一些乱七八糟的东西当做人脸,实在不敢恭维。好在随着深度学习领域的发展,涌现了一大批效果相当不错的人脸检测算法,比如MTCNN,给了我们更多施展的空间。看看下面这图就是基于其检测出来的,看着是不是很震撼呢?源码点此MTCNN效果着实不错,但其...
2017-12-26 22:45:55
9945
9

原创 ssd-models: make caffe-ssd great again
快速上手从releases下载转换好的Face模型, 将其置于Face文件夹下. 下载demo脚本, opencv版demo.py或caffe版demo_caffe.pyNote: opencv版需要依赖3.4.*及以上, pip install opencv-python==3.4.0.14调整脚本里设置模型的路径,选择从文件夹测试或者从摄像头运行, python python/demo.py1. 下载并编译ssd原始版本仅能在ubuntu下编译通过,这里提供一个可以在W..
2017-09-13 23:06:22
4118
1

原创 基于EasyPR的车牌识别android实现
EasyPR4Android,基于EasyPR1.5beta的android实现更新:添加编译好的安装文件采用android studio2.3.3大幅简化ndk开发的配置mrcar特性:1.支持拍照和支持图库浏览识别2.ndk调用OpenCV3.从assets读取并复制文件4.采用多线程进行识别处理5.支持单击进行原图和识别结果之间的切换采用android studio2.3.3开发实现,ndk版本为R12d,OpenCV版本为3.2,android SDK版本
2017-09-11 22:37:41
2324
4
原创 img2pose: 通过6DoF姿态估计进行人脸对齐和检测
论文:https://arxiv.org/abs/2012.07791代码:http://github.com/vitoralbiero/img2pose摘要我们提出了一种实时的6自由度3D人脸姿态估计方法,其不依赖于人脸检测和关键点对齐.我们观察到直接估计6自由度刚体变换是一个比在3D人脸对齐中广泛使用的关键点检测更简单的问题。基于此我们做出了一下几个贡献(a)我们提出了一个不需要人脸检测的易于训练、高效的基于Faster-RCNN的直接回归图片中所有脸姿态的方法(b)我们阐述了如何转换姿态并
2021-02-19 11:38:39
39
原创 Paddle单阶段口罩检测
Paddle官方有一个口罩检测的示例,但是其是两阶段的,首先要检测出人脸,再将裁剪下来的人脸进行二分类.facemask曾基于YOLO V2实现过单阶段口罩检测,但是速度在移动端不是很快,仅能用于服务端部署,且由于样本缺乏,实测精度也不是很高.FaceMaskDetection 实测速度非常快,在CPU上就能实时,而且开源了网络结构,还能进一步压缩耗时,其提供了caffe、pytorch、tensorflow、onnx和mxnet等近乎全平台的支持,美中不足的是唯独缺了paddle
2020-11-21 11:32:31
1622
原创 mmpose教程
mmpose是商汤开源的基于pytorch的姿态估计库,当前0.7分支需pytorch1.3及以上,0.6需pytorch1.0及以上.主要特性包括:支持多种不同的任务,支持研究领域宽广的主流人体姿态相关的分析任务,包括2D多人姿态估计、2D手势姿态估计、133点全身姿态估计、3D网格恢复等 高效和高精度,实现了多种基于深度学习的自顶向下和自底向上的方法,取得了比诸如HRNet等其他代码库更快的速度和更高的精度,参见benchmark.md 支持多种数据集,支持COCO、AIC, MPII, M
2020-10-29 16:36:07
310
原创 北京2020积分落户名单
之前写过北京2018积分落户名单和北京2019积分落户名单,如今2020的也来了,由于公司太多,只列出人数大于5的公司,分布相比之前更加分散
2020-10-16 22:14:46
2262
原创 OpenGL从入门到精通
所谓OpenGL,也就是开放图形接口,定义了操作显卡绘制的一些函数,为上层应用提供了平台无关的实现,将游戏开发人员从繁琐的数学计算过程中解放了出来.首先有个很重要的地方是要搞清楚CPU和GPU的区别在哪?有好几核CPU用着它不香嘛,为啥又出来个GPU?
2020-05-30 12:40:08
260
原创 yolov4训练自己的数据
darknet,如果想要训练yolov2-voc.cfg,yolov2-tiny-voc.cfg,yolo-voc.cfg,yolo-voc.2.0.cfg类似更早的版本,请点击这个链接训练Yolo v4 (and v3):0. 训练cfg/yolov4-custom.cfg需要下载预训练模型yolov4.conv.1371. 拷贝yolov4-custom.cfg 并命名为yolo-obj.cfgbatch=64subdivisions=16max_batches设成要训...
2020-05-19 14:25:58
1512
原创 pytorch 从入门到精通
pytoch中Tensor和Variable有什么区别?Sequential和ModuleList有什么区别?直接调用model(input)和调用model.forword(input)有什么区别?DataSet要实现哪几个函数?怎么获取网络的计算量和模型大小?pytorch-summary有哪些提高pytorch 训练速度的trick?pytorch有哪几种模型加载和保存方...
2020-04-12 13:35:57
334
原创 ARM 内联汇编 加速 算法
矩阵乘法作为深度学习卷积的实现,直接影响最终的速度,如何处理才能榨干处理器的行能呢?OpenBLAS gemm从零入门
2020-04-06 18:41:58
225
原创 北京2019积分落户名单
去年总结过2018年落户的统计结果,今年的也出来了,完整名单见落户公示,整理了个excel版的(百度盘,提取码aaiq)目录公司分布年月分布年份分布月份分布公司分布先看看公司分布,壮哉大华为,沸腾吧.排序 公司名称 落户人数 1 北京华为数字技术有限公司 217 2 中央电视台 111 3 联想(北京)有限公司...
2019-10-19 20:49:55
19818
原创 树莓派基于深度学习的一些有趣应用
https://github.com/burningion/poor-mans-deep-learning-camera:使用flask的鸟类检测服务Raspberry Pi: Deep learning object detection with OpenCV:基于opencv dnn进行目标检测https://github.com/dingdang-robot/dingdang-rob...
2019-09-08 12:48:51
2580
原创 移动端深度学习框架选型对比
手机运行AI能力排名ai-benchmarkCPU单线程性能比较(从快到慢):PaddleLite > MNN > NCNN > MACE > TFLite; CPU2线程性能比较(从快到慢):PaddleLite ≥ MNN > NCNN > MACE > TFLite; CPU4线程性能比较(从快到慢):MNN ≥ PaddleLite >...
2019-08-20 19:28:51
1564
原创 nvidia-dali GPU加速预处理
当我们使用pytorch训练小模型的时候会发现GPU利用率很低,训练速度非常慢,profile发现预处理速度很慢,很多时候都是GPU在等CPU的数据,造成了严重的浪费,而dali就是利用GPU进行预处理,可以极大的提高训练的效率.
2019-08-17 18:51:46
9084
10
原创 gtop: 一款类似于htop的显卡信息查看工具
nvidia-smi提供了显卡使用相关的一系列信息,但是其在最为关键的命令信息却十分简洁,当有多块卡时,清一色的python或者caffe很难分清哪个是谁起的,此外有的程序占用多张卡跑,重复的显示也没有必要。#coding=utf-8import osimport sysimport reimport pwdimport timeimport psutilimport subp...
2019-08-15 15:10:51
834
原创 android实现类似扫描二维码的界面
从zxing的项目里提取出来的,不过省去了配置一堆xml的麻烦import android.annotation.SuppressLint;import android.content.Context;import android.graphics.Canvas;import android.graphics.Color;import android.graphics.LinearG...
2019-08-06 15:13:29
642
原创 android 摄像头预览最简代码
移动端深度学习视觉应用最基本的就要和摄像头打交道,试想一下如果让你设计android的camera接口,你应该怎么设计?首先摄像机是一种硬件,应该有基本的打开、关闭操作,对应的实现是Camera中的open和close,然后有前后摄像头甚至是三摄、四摄等,应该提供个查询设备信息的接口,对应的实现是Camera.CameraInfo。那怎么把采集到的数据画到控件上去呢?肯定要从View派生子类,就叫SurfaceView,为了应用MVC的思想,还应有个SurfaceHolder, 用来控制摄像机的开
2019-08-06 14:34:19
2168
2
原创 paddlepaddle部署训好的模型到server上
在paddlepaddle训练自己的数据集中我们训好了自己的模型,由于其含有训练所需的信息,因此可能会比较大,我们可以用save_inference_model来保存推理时的模型,可以到1/4左右。 place = fluid.CUDAPlace(0) if args.use_gpu else fluid.CPUPlace() exe = fluid.Executor(plac...
2019-08-05 14:26:14
1340
原创 swift opencv开发
首先下载opencv在ios的库opencv2.framework,官网上有很多版本,我用的是3.4.7的。然后打开XCode,新建一个swift的SingleView的工程,名字啥的随便,叫com.yanyu.OpenCVDemo就好了然后在工程项目上右键,选择"Add Files to OpenCVDemo",找到刚才下载的opencv2.framework的位置,勾选Copy ite...
2019-07-27 18:36:51
1181
原创 InactivityTimer android定时退出Activity
由于手机资源有限,特别是电池不给力,如果是高耗能的任务,在开发过程中经常遇到检查空置一段时间后就要退出的需求。核心是使用ScheduledExecutorService定时启动,为此构造了一个InactivityTimer类package com.yanyu.inctest;/* * Copyright (C) 2010 ZXing authors * * Licensed und...
2019-07-14 18:55:55
1073
原创 paddlepaddle int8量化
之前写过一篇,paddle detection 量化 已废弃,不过目前这种方式已经废弃,目前采用的是PaddleSlim, 改造起来更简单.有关量化的原理和代码实现可以参考NCNN Conv量化详解,代码详解,里面讲的很详细,其实无非就是在卷积层之前插一个乘法转成int,在卷积完成之后再除下.不过PaddleSlim例子里使用的是同步读数据的方式,而ssd等检测代码使用的都是异步读数据的方...
2019-07-05 22:05:30
714
原创 paddlepaddle训练自己的数据集
训练自己的数据集是提升功力的必经之路,已经有人写了《PaddlePaddle从入门到炼丹》十一——自定义图像数据集识别,但是其存在几个问题:1.无法使用多GPU训练2.没有使用异步加载数据致使GPU利用率低3.结构设计不合理,无法养成良好的编码规范如果手头没有相关的数据,可以使用PaddleHub下的image_classification,其会自动下载所需的数据集和预训练模型,然...
2019-06-28 15:53:11
3087
原创 rk3399 pro开发环境搭建和使用
rk3399 pro是rk3399的升级版,购买链接:风火轮科技,官方教程,论坛,github地址,视频教程rknn-toolkit-V1.1.0组件库它支持linux和android两种系统,android下的开发相对简单,记得在接通电源前长按Reset旁的recovery键进入android8.1系统.这儿重点讲的是官方没提到的linux系统安装,这个linux系统是fedora...
2019-03-20 16:11:02
7979
1
原创 VSCode 调试opencv代码
VSCode中安装必须的插件C/C++和Code Runner,可选插件C/C++ Snippets和Include Autocomplete在MRHead中切换目录至MRCrossPlatform(之前记得sh setup.sh安装项目把头文件复制到指定位置哦)将MRCrossPlatform目录拖至VSCode上打开里面代码也很简单:#include "mrdir.h"#i...
2019-02-20 13:36:46
7597
原创 以resnet50为例浅析经典模型在各个框架的实现
最近要在paddlepaddle上实现mnasnet,要对各大框架实现有所了解。resnet50是比较经典的用于图像分类的网络,其在各大框架均有实现。我们先来看caffe的prototxt实现,大改要写2300多行代码,不仅写的费劲,而且很容易出错,这里就不贴代码了.通过Netscopes可视化当然也有有用python写的,很是简洁import caffefrom caff...
2018-12-28 15:57:22
2763
原创 opencv3使用KCF或TLD跟踪
TLD作者使用的版本是opencv2.*,在3.*上编译会报一堆问题,好在OpenTLD_OpenCV3已经给出了解决方案,不过自从opencv3.0开始就在contrib模块中自带了tracking模块,因此自己编译这个模块后使用这些算法还是很方便的.#include <opencv2/tracking.hpp>#include <opencv2/opencv.hpp&...
2018-12-27 20:27:07
3184
原创 带权二分图最大匹配
带权二分图可用于描述视觉中很多经典的匹配问题,解决它的算法是匈牙利算法和KM算法.已有很多文章对此做了详细的解读,km算法入门中详尽描述了每一步的状态,而KM算法详解+模板中给出了实际代码中常用的代码模板.不过我们写AI相关算法更为熟悉的是python,幸好有个munkres库,省了很多功夫.安装非常简单,直接pip install munkres即可。可惜的是没有相关中文解释其...
2018-12-21 19:13:20
932
原创 thrift安装和使用
首先安装必须的依赖库sudo apt-get install automake bison flex libssl-dev然后拉取代码并编译git clone https://github.com/apache/thriftcd thriftmake -j4sudo make install还是推荐用python版本,C++版实在是太麻烦了,默认的CMakeList.t...
2018-11-10 12:19:36
883
原创 基于caffe的模型压缩
训练出来的模型有很多参数,比如AlexNet有高达6千万个,体积有232MB之大,具体计算方法参见深度学习 计算模型中每层参数的个数和FLOPs,对于部署到移动端来说显然是不合适的,那么怎么样才能减少模型的体积呢?怎么样才能加速呢?
2018-11-02 17:45:51
1539
原创 人脸性别和年龄识别
本文是对age-gender-estimation项目的详细讲解,它给出了使用keras进行性别和年龄识别的完整流程。数据采用的数据集为imdb-wiki,这是一个包含20,284名人的460,723张以及维基百科上imdb的62,328张共计523,051 张人脸图像的数据集,是目前开源的数据集中量级最大的,它给出了图像中人物的性别和出生时间、照片的拍摄时间等信息。原始的图片很大,分...
2018-10-20 13:22:16
9358
12
原创 CelebA数据集详细属性统计
CelebA是香港中文大学提供的包含10,177个名人身份的202,599张人脸图片的数据集,其提供了5个点的人脸关键点坐标以及40个属性,可以在Large-scale CelebFaces Attributes (CelebA) Dataset下载.各属性的含义请参考文末给出的链接,本文的代码用于统计其各属性的数量rootdir="../"imgdir=rootdir+"Img/im...
2018-10-18 10:17:19
5480
3
原创 北京2018积分落户名单
北京2018积分落户名单已经公示出来了,地址在北京人力和社会保障局官网,共有6019人获得,恭喜他们,最低分为90.75分。Update:2019 年的也出来了,详情请见https://blog.csdn.net/minstyrain/article/details/102642906.网站每页只能显示100页的内容,浏览起来很不方便,这里提供完整的excel表格形式的数据,详见百度网盘(...
2018-10-17 20:06:31
79401
3
原创 mmdetection 港中文媒体实验室开源的检测工具箱和评估基准
mmdetection是商汤开源的用于深度学习目标检测的库, 相比于早先开源的Detectron,maskrcnn-benchmark和SimpleDet具有以下特性:模块化设计,将检测或者分割任务分解成几个模块,通过模块的组合即可完成相应的任务开箱即用,实现了多种目标检测和分割算法,易于配置和使用高效 所有对包围框和掩码的操作都可以在GPU上完成领先性,获得过2018年COCO检测比赛的冠军,并且还在不断进化
2018-10-15 10:12:40
12247
原创 回溯-松弛法 一笔画完 完全攻略
目录基本思路美食喵 1-135关西瓜喵1-15关蓝莓喵16-30关咖啡喵31-45关番茄喵46-60关豆沙喵61-75关橙汁喵76-90关紫薯关91-105关拿铁喵106-120关奶茶喵135关社会喵 136-270关原谅喵136-150关小夜喵166-180关少女喵181-195关电竞喵196-210关画家喵211-225关...
2018-10-06 00:04:04
40154
Image Watch for python
2020-06-08
编译原理课程设计 MFC实现
2012-01-15
ProcessControl.rar
2011-12-13
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net
发表于 2018-02-12 最后回复 2018-02-24
OpenGL纹理贴图贴上摄像头实时采集的图像
发表于 2012-11-22 最后回复 2018-02-12
211高校程序员交流群
发表于 2012-05-13 最后回复 2012-11-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝