自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shaoxiaohu的专栏

耐得寂寞,拥得繁华

  • 博客(94)
  • 收藏
  • 关注

原创 【论文笔记】Additive Margin Softmax for Face Verification

之前的L-Softmax, A-Softmax引入了角间距的概念,用于改进传统的softmax loss函数,使得人脸特征具有更大的类间距和更小的类内距。作者在这些方法的启发下,提出了一种更直观和更易解释的additive margin Softmax (AM-Softmax)。

2018-01-28 21:28:33 9450

原创 【论文笔记】Two Birds with One Stone: Iteratively Learn Facial Attributes with GANs

GAN在生成高保真度的变换图方面具有其它方法所没有的优势。在这篇文章里,作者通过集成的损失函数来正则化最小最大过程,从而完成GAN模型的训练。这个集成的损失函数不仅包括像素级loss,而且包括既能提高生成图片质量又能保留身份信息的感知loss。

2018-01-21 22:30:21 696

原创 【论文笔记】VGGFace2——一个能够用于识别不同姿态和年龄人脸的数据集

.VGGFace2 是一个大规模人脸识别数据,包含331万图片,9131个ID,平均图片个数为362.6。

2018-01-10 14:53:31 30149 7

原创 【论文笔记】SphereFace: Deep Hypersphere Embedding for Face Recognition

这篇paper提出Angular-Softmax(A-Softmax)去学习判别特征,它在超球面流形上强加了一个判别约束,而这个超球面流形本质上与人脸的先验知识位于同一个流形上。

2017-12-24 14:55:13 4649 1

原创 【论文笔记】GAN-摘要-201709

【1】Huang R, Zhang S, Li T, et al. Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis[J]. arXiv preprint arXiv:1704.04086, 2017.TP-GA

2017-09-20 13:09:35 1844

原创 Windows下加载CAFFE模型的问题

试着把linux训练的caffe 模型在windows环境下运行起来,因为是自己改过的caffe代码,又只有VS2012,并没有下载官网的windows版本(支持VS2013及以上)。把相应的caffe源码拷过来,配置好各种库(hdf5/protobuf/boost/glog等),使用protoc.exe生成相应的caffe.pb.h和caffe.pb.cc,使用windows的库函数替换了一些函数

2017-09-13 14:32:58 1406

原创 【论文笔记】Large-Margin Softmax Loss for Convolutional Neural Networks

参考文献: Liu W, Wen Y, Yu Z, et al. Large-Margin Softmax Loss for Convolutional Neural Networks[C]//Proceedings of The 33rd International Conference on Machine Learning. 2016: 507-516.摘要Softmax Loss 函数经

2016-11-25 21:54:36 13362 4

原创 【论文笔记】Object Tracking_简略版_201608

【1】Held, D., Thrun, S., & Savarese, S. (2016). Learning to Track at 100 FPS with Deep Regression Networks. arXiv preprint arXiv:1604.01802.这篇文章提出了一种基于深度学习的目标跟踪算法,有以下几个特点: 1)快,100fps,比之前大多数采用深度学习的跟踪

2016-08-16 15:06:50 1705 5

原创 【论文笔记】Spatial Transformer Networks

卷积神经网络(CNN)已经被证明能够训练一个能力强大的分类模型,但与传统的模式识别方法类似,它也会受到数据在空间上多样性的影响。这篇Paper提出了一种叫做空间变换网络(Spatial Transform Networks, STN),该网络不需要关键点的标定,能够根据分类或者其它任务自适应地将数据进行空间变换和对齐(包括平移、缩放、旋转以及其它几何变换等)。

2016-07-02 12:46:04 33471 7

原创 【论文笔记】未分类_2016

【1】Kemelmacher-Shlizerman I, Seitz S M. Collection flow[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 1792-1799.计算一对人脸图像(I,J)(I, J)之间的光流,容易受到光照、姿态以及其它变化的影响。作者

2016-06-29 17:24:37 3654

原创 【论文笔记】Text-Recognition_简略版_201606

【1】Shi B, Wang X, Lv P, et al. Robust Scene Text Recognition with Automatic Rectification[J]. arXiv preprint arXiv:1603.03915, 2016. 上图即为本篇论文的系统框架:包括 Spatial Transformer Network (STN ) 以及 Sequence Reco

2016-06-28 10:13:34 4721 5

原创 文字检测、分割、识别可用资源

OpenCV示例:链接 用到了Neumann L., Matas J.: Real-Time Scene Text Localization and Recognition, CVPR 2012论文提到的算法以及tesseract工具。tesseract是一个开源的OCR开发工具,之前由google发布,现在放在Github上, 链接。 在linux上安装,可以参考:ubuntu安装教程链接,C

2016-05-31 14:04:37 3141

原创 Invalid MEX-file "caffe_.mexa" 的解决方法

在使用Matlab 运行caffe 库的过程中,有时会因为Matlab 和 caffe 版本的不一致出现以下类似的错误: Invalid MEX-file ‘*/caffe/matlab/caffe/caffe_.mexa64’: /usr/local/Matlab/R2013a/sys/os/glnxa64/libstdc++.so.6: undefined symbol:出现这种错误的原因是因

2016-05-14 22:39:33 9735 4

原创 【论文笔记】Text-Detection_简略版_201604

最近在研究一个新课题-Text Detection,正在读论文中。。。201604261、Zhang Z, Zhang C, Shen W, et al. Multi-Oriented Text Detection with Fully Convolutional Networks[J]. arXiv preprint arXiv:1604.04018, 2016.这篇文章将局部和全局信息结合,使用

2016-04-26 17:31:54 11443 1

原创 【论文笔记】人脸关键点检测_简略版_2016

20160331 1、Zhang Z, Luo P, Loy C C, et al. Learning deep representation for face alignment with auxiliary attributes[J]. 2015.在论文“Facial landmark detection by deep multi-task learning”上的改进(见http://blo

2016-03-31 09:55:38 7901

原创 【论文笔记】Leveraging Datasets with Varying Annotations for Face Alignment via Deep Regression Network

参考文献: Zhang J, Kan M, Shan S, et al. Leveraging Datasets With Varying Annotations for Face Alignment via Deep Regression Network[C]//Proceedings of the IEEE International Conference on Computer Visio

2016-03-20 17:08:37 2951 1

原创 【论文笔记】3D人脸重建_简略版(时时更新中)

201601161. Zhu X, Lei Z, Yan J, et al. High-Fidelity Pose and Expression Normalization for Face Recognition in the Wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition

2016-02-21 15:01:20 5725

原创 递归实现 从n个数中选取m个数的所有组合

有n(n>0)n(n>0)个数,从中选取m(n>m>0)m(n>m>0)个数,找出所有的组合情况(不分顺序)。这样的组合共有 Cmn=n×(n−1)×⋯×(n−m+1)m!C_n^m = \frac {n \times (n-1) \times \cdots \times (n-m+1)} {m! }. 一个数组 data 有 n 个元素,从中选取 m 个数的组合 arr,使用递归算法实现是这样一

2016-02-18 11:24:11 29993 5

原创 C++排序索引

使用C++时,可以使用STL的sort函数对数据或向量进行排序,但如何像Matlab的sort函数一样获取排序索引呢? [sort_v, index]=sort([3, 2, 1]) sort_v = 1 2 3 index = 3 2 1使用如下函数(引自:http://qa.helplib.com/465162),即可获取向量v 的排列索引。template < typename T> v

2016-02-04 15:32:57 7977 4

原创 【论文笔记】人脸关键点检测_简略版(时时更新中...)

201601151. Jourabloo A, Liu X. Pose-invariant 3d face alignment[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 3694-3702.PIFA通过一个可变的人脸3D模型,在回归过程中引入更多的变量,如摄像头投影矩阵、3D关键点等,

2016-01-15 18:06:17 5025

原创 【论文笔记】One Millisecond Face Alignment with an Ensemble of Regression Trees

简介CVPR 2014的一篇关于人脸关键点检测的论文,基于Ensemble of Regression Tress算法(以下简称 ESR),速度极快(单人人脸关键点检测耗时约为1ms),效果也不错。同时又能处理训练集中部分关键点标定缺失的情况。

2016-01-10 16:56:05 14950 17

原创 写在Paper Reading之前

写在Paper Reading 之前2016年第一篇文章,就以paper reading开头,这段时间最少写五篇,达到申请专栏的条件。通过申请专栏,也可以达到监督作用,催促自己多看、多想、多写。【1】每周一篇CV论文阅读笔记,多则不限。 【2】理清文章思路,尽可能将流程解释清楚。 【3】阐述自己读后的思考。 【4】写清楚文献出处,便于之后写论文引用。由于自己理解不深,会时常犯错,这也是展示错误

2016-01-04 19:35:42 1714

原创 D3D保存当前视图的问题

以前使用过D3DXSaveSurfaceToFile保存当前视图(详见[保存当前视图](http://blog.csdn.net/shaoxiaohu1/article/details/8534527)),但在电脑锁屏后,保存的图片却没全黑的图片。 网上查找了原因,原来是在锁屏后,d3d中的设备丢失,详见:[DirectX 3D 设备丢失(lost device)的处理](http://www

2015-09-09 19:52:51 1091

原创 linux编译动态库和静态库的makefile示例

根据GenDll.cpp文件,分别生成动态库.so和静态库.a文件,需要依赖的外部库为opencv。1. 静态库的生成makefile命令的简介可参考:跟我一起写 Makefile。使用ar命令生成.a文件,可参考:Linux下动态库(.so)和静态库(.a)# 1、准备工作,编译方式、目标文件名、依赖库路径的定义。CC = g++CFLAGS := -Wall -O3 -std=c++0x

2015-07-18 16:07:48 78052 4

原创 CV各技术论坛及QQ群

计算机视觉(Computer Vision)最近这几年发展迅速,技术论坛和QQ群也如雨后春笋,特别是人脸检测/识别领域。近段时间我也跟风似的加了好几个论坛,收藏了若干网站,记录下,与各位共享。如果还有更多更好的网站,也希望大家补充。视觉与学习青年学者研讨会 VALSE论坛http://www.valseonline.org/portal.php大牛比较多,信息更新也比较快,涵盖的领域也比较多。每周定

2015-06-23 14:01:19 5914

原创 Matlab的Profile功能

Matlab的Profile功能编程过程中,经常需要评估哪一部分代码比较耗费时间,这对于优化代码非常重要。Visual Studio中的profile功能可以评测,Matlab同样也有这个功能,而且使用起来也比较简单。-基本命令 profile on : 开启profile profile off: 关闭profile profile clear: 清空历史数据 pro

2015-06-13 10:48:45 19910 2

转载 linux命令合集

linux命令命令,不断更新中。。。主要包括各个博客链接,无原创内容。1、linux下文件夹的创建、复制、剪切、重命名、清空和删除命令      链接:点击打开链接2、linux统计某文件夹下文件、文件夹的个数     链接:点击打开链接

2015-04-14 10:29:58 964

原创 Matlab并行计算示例(一)

使用Matlab实现算法较为简单,但是涉及for循环时,效率比不上C++。对于一个多核处理器,不开多核并行计算,实在是对不住Matlab自带的并行计算功能。parfor循环较为简单,但是它对for循环中的变量要求比较严格,稍有不慎就会出错(我深受其害)。使用Matlab Toolbox中的createJob/createTask可以实现多线程的并行计算,其功能与C++中CreateThread类似

2015-03-25 14:42:09 27456

原创 使用POSIT算法估计物体角度

POSIT算法(DeMenthon & Davis 1995) 能够根据2D图像中的若干特征点位置,估计出物体在3D上角度(比如人脸)。下面是使用OpenCV的POSIT算法的使用示例,引自:opencv posit sample1、对象声明CvPOSITObject* positObject;就是这个简单的CvPOSITObject的结构体。

2015-02-07 16:51:39 11513 11

原创 VS2008 Team Suite 蓝屏及解决办法

编程过程中经常需要查看哪个部分比较耗时,VS2008 Team Suite版提供了profile功能,可以帮助查看代码各部分所占用的时间百分比。但是Team Suite版在Intel 处理器下经常出现蓝屏,网上查了原因,是因为VS 2008先于i5 i7等处理器出现。硬件问题,怎么解决也是解决不了了。幸好VS2010的一般版本里,也有profile功能。 我在Intel I7处理器的电脑测试了

2015-02-06 17:50:15 1897

原创 C++获取文件字节数

比较简单,直接上源码:FILE *file = fopen(filePath, "rb");if (file == NULL){ printf("loading file failed!/n"); return false;}long fileLen = filelength(fileno(file));fclose(file);其中:filelength即为

2015-01-30 11:31:30 9022 2

原创 csdn帐号被盗

CSDN帐号被盗,一直以为技术类博客很安全,没想到也会享受QQ、淘宝帐号待遇。2015年1月19日19:00至2015年1月20日9:00之间操作均非本人操作,也提醒各位注意帐号安全。

2015-01-21 17:24:28 1305 1

原创 通过3维旋转矩阵计算欧拉角

在得到3D模型的旋转矩阵(Rotation Matrix)后,需要求取3D模型的相对于各个轴的角度,有以下资料可查:可参考的资料:简易版:http://stackoverflow.com/questions/15022630/how-to-calculate-the-angle-from-roational-matrix通用版:http://staff.city.ac.uk/~sbbh

2015-01-21 17:19:58 11841

原创 matlab一些小命令(不断更新中)

使用Matlab时,有些小命令非常有用,但是时间一长,总是容易忘。在这里,把这些命令记下来,随时查看。1. 查看数据类型所占字节数,类似C语言中sizeof  whos使用方法:a = uint32(2)a_info = whos(a)        a_info为一个结构体,a.bytes即为变量所占节字数。

2014-12-11 10:38:04 990

原创 使用OpenCV查找二值图中最大连通区域

上一篇博文中介绍了matlab查找最大连通区域的方法,OpenCV函数中也有类似

2014-10-19 22:31:57 36461 3

原创 Matlab中regionprops的使用示例

有这样一幅图,我们想获取其中的联通区域

2014-10-19 22:03:44 25509 2

原创 使用标准模板库map出现错误C2784,C2676

使用map过程中,出现以下错误:

2014-10-14 23:34:42 6569

原创 OpenCV中cv::Mat字节对齐方法

实验过程中用到的SDK中函数fds

2014-09-15 23:04:46 9360 2

原创 mex代码调试

1)  首先使用-g选项编译MEX文件:mex genTest.cpp  -I'D:\opencv248\opencv\build\include'-L'D:\opencv248\opencv\build\x64\vc10\lib' -lopencv_ml248d -lopencv_core248d2)  打开Visual Studio, 选择工具->附加到进程菜单项,如下图所示:

2014-07-13 23:22:16 3145 1

原创 mex如何调用外部库(以OpenCV为例)

程序编写完成后,在matlab下使用mex命令生成相应的mex文件。

2014-07-13 23:18:38 10249

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除