人脸识别
JensLee
这个作者很懒,什么都没留下…
展开
-
DSFD: Dual Shot Face Detector
人脸检测,南京理工、腾讯实验室联合编写DSFD: Dual Shot Face DetectorJian Li, Yabiao Wang, Changan Wang, Ying Tai, Jianjun Qian, Jian Yang, Chengjie Wang, Jilin Li, Feiyue Huanghttps://blog.csdn.net/wwwhp/article/de...原创 2019-12-28 10:15:22 · 593 阅读 · 0 评论 -
SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation
本文由国立台湾大学实验室发表。主要内容:根据图片预测人物年龄。主要方法:1.将年龄由回归问题转化为分类问题,使用分段回归预测年龄。2.使用动态范围来包含年龄可能出现的区间,也就是说我预测年龄在[30,33]岁之间,也可以转移到[27,30]之间。论文的第三章:SSR-NET结构与方法简述3.1采用MAE作为损失函数。3.2分段预测将年龄范围定为【0, V】,例...原创 2019-10-15 11:16:11 · 890 阅读 · 0 评论 -
TypeError: img is not a numpy array, neither a scalar
查得别人的资料,说是用的图片地址,不是imread读进去的,我这个情况不一样。在运行hyperface代码中遇到了这个问题,本来是这么改得img = np.array(img),强制转换,结果不能转。最后查资料,再cupy的官方文档上写着使用cupy.asnumpy()即可。即:import cupyimg = cupy.asnumpy(img)相关网址:http...原创 2019-03-05 20:51:16 · 14066 阅读 · 5 评论 -
CNN卷积各层的参数和链接个数的计算
设定不同卷积层,接受图像与输出图像的stride,filters的大小:卷积层(Conv Layer)的输出张量(图像)的大小定义如下:O=输出图像的尺寸。I=输入图像的尺寸。K=卷积层的核尺寸N=核数量S=移动步长P=填充数输出图像尺寸的计算公式如下:输出图像的通道数等于核数量N。示例:AlexNet中输入图像的尺寸为227*227*3.第一个...原创 2019-03-14 16:40:54 · 1493 阅读 · 0 评论 -
distentangling 3d pose in a dendritic cnn for unconstrained 2d face alignment
Abstract热图回归常被用于关键点监测。在本文中,我们提供一种树状CNN,称作:PCD--CNN。分类网络:是一个伴随第二级与模块化的分类网络。根据贝叶斯公式,我们分解3D头部,通过估量关键点的在角度的预测,因此不同于复杂任务。我们没有增加或者拓宽神经网络,我们使用mask-softmax损失与困难样本挖掘来1训练CNN。INTRODUCTION面部识别与关键点定位常常使用眼,...原创 2019-03-22 22:28:48 · 551 阅读 · 0 评论 -
AFLW2000数据库介绍
数据库下载地址:http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm发现目前没有介绍AFLW2000数据库的博客。记录一下,随便找了一个mat文件,读取了一下,内容如下所示,是一个dict,pt2d指的是2维平面21个特征点的坐标,他们的shape我都打印了出来。Pose_Para前三个参数是头部姿态,弧度值...原创 2019-04-11 15:27:04 · 6236 阅读 · 8 评论 -
Face Video DataBase
官方地址https://vdb.kyb.tuebingen.mpg.de/login.php介绍:OverviewThis database contains videos of facial action units which were recorded starting in the autumn of 2003 at the MPI for Biological Cybe...原创 2019-04-02 15:12:28 · 713 阅读 · 0 评论 -
BIWI人脸数据库介绍 Biwi Kinect Head Pose Database
官方网址:https://data.vision.ee.ethz.ch/cvl/gfanelli/head_pose/head_forest.html#db1.数据库中将近15000张照片,其中角度包含有:yaw:±75度,pitch:±60度,roll:±50度。2.由Kinect v2设备采集。3.24个序列,包含20个人(6女14男)。以大约一米的距离转动头部。4.每...原创 2019-04-18 09:48:02 · 5554 阅读 · 3 评论 -
FSA-Net: Learning Fine-Grained Structure Aggregation for Head Pose Estimation from a Single Image
本文来源于2019A类会议CVPR的论文FSA-Net,对其中一部分进行翻译摘要:本文提出了一种基于单个图像的头部姿态估计方法。以往的方法往往是通过landmark或depth估计来预测头部姿态,计算量大。我们的方法是基于回归和特征聚集。为了得到一个紧凑的模型,我们采用了soft stagewise regression方案。现有的特征聚集方法将输入视为一组特征,从而忽略它们在特征图中的空...原创 2019-12-28 10:14:29 · 1281 阅读 · 0 评论 -
keras中LSTM学习
keras中LSTM函数包含三个参数:第一个是样品,第二个是时间戳,第三个是特征。输入数据必须是三维的,否则会报错。例如代码这么写:old是四维数据new = LSTM(64)(old)就会报错:需要的是三维,结果传入的函数是四维,就会报错。...原创 2019-07-11 13:34:26 · 1780 阅读 · 0 评论 -
pitch, roll, yaw的区分
最近研究头部姿态,三个角度搞得头大。pitch是围绕X轴旋转,也叫做俯仰角。 yaw是围绕Y轴旋转,也叫偏航角。 roll是围绕Z轴旋转,也叫翻滚角。 在3D系统中,假设视点为原点,则视点坐标系如下图所示,通常z轴的负方向是视点方向...转载 2019-02-28 22:01:05 · 44752 阅读 · 3 评论 -
sudo: /etc/sudoers.d 可被任何人写
在linux操作的时候,出现报错 sudo: /etc/sudoers.d 可被任何人写 有解决方案如下:sudoers的权限被改了,改回来就好了pkexec chmod 0440 /etc/sudoers 之后出现报错:pkexec must be setuid root 目前正在找解决方案,搜了一下,给出的是,重启系统,按ESC或者Shift,会...原创 2018-12-07 12:18:01 · 6920 阅读 · 1 评论 -
安装caffe遇到的bug,并且还不知道咋改
1.nvcc fatal : Unsupported gpu architecture 'compute_20'有一个解决的博客,我试了是不行:https://blog.csdn.net/sysuwuhongpeng/article/details/45485719原创 2018-12-05 10:16:19 · 362 阅读 · 0 评论 -
AFLW:Annotated Facial Landmarks in the Wild: A large-scale, real-world database for facial landmark
简单翻译了一下AFLW的论文(解释说明书)。AFLW是一个人脸库,一共有25993张人脸图像,它最突出的特点是在人脸关键点上定位了21个点,更容易被检测。其次图片质量比较高,不仅仅是室内,还有室外,侧脸等难于检测的情况都涵盖在它的人脸库中。AFLW提供alw.sqlite,数据里面记载了每张图片的信息,及标志点等等。后期再补上翻译。链接仅可用于学校研究,请勿外传。我本人用其测试一下...原创 2018-11-20 16:59:20 · 1729 阅读 · 0 评论 -
深度学习之图像分类模型AlexNet解读
版权声明:本文为博主原创文章 https://blog.csdn.net/sunbaigui/article/details/39938097 在imagenet上的图像分类challenge上Alex提出的alexnet网络结构模型赢得了2012届的冠军。要研究CNN类型DL网络模型在图像分类上的应用,就逃不开研究alexnet,这是CNN在图像分类上的经典模型(DL火起来之后)。在DL...转载 2018-11-16 17:27:01 · 1372 阅读 · 0 评论 -
选择性搜索Selective Search for Object Recognition
本文地址:https://link.springer.com/article/10.1007/s11263-013-0620-5AbstractSelective Search结合穷举搜索与分割进行物体识别,同时结合图像层次进行识别。与穷举搜索不同的是,本论文提出能不能把大部分无用的区域删掉,只留下可能存在对象的区域,这样会大量的节省时间。作者借助层次聚类的方法,进行对象识别。...翻译 2018-11-21 22:38:37 · 643 阅读 · 0 评论 -
人脸识别杂谈
Gabor 及 LBP 特征描述子是迄今为止在人脸识别领域最为成功的两种人工设计局部描述子。对各种人脸识别影响因子的针对性处理也是那一阶段的研究热点,比如人脸光照归一化、人脸姿态校正、人脸超分辨以及遮挡处理等。2013年:微软亚洲研究院的研究者首度尝试了 10 万规模的大训练数据,并基于高维LBP 特征和 Joint Bayesian 方法在 LFW 上获得了 95.17%的精度。这一结果...转载 2018-11-19 20:41:08 · 1471 阅读 · 0 评论 -
Fine-Grained Head Pose Estimation Without Keypoints
1Abstract传统的头部姿态计算是通过从目标面部提取关键点,本文认为这是没有效率的。我们在300W-LP(一个大型的综合扩展数据集)上提出了一种优雅而鲁棒的训练多重损失卷积神经网络确定内禀欧拉角(横摆、俯仰和横摇)的方法。论文地址:https://arxiv.org/abs/1710.00925v2github源码地址:https://github.com/natanielruiz...翻译 2019-03-22 11:06:41 · 1691 阅读 · 0 评论 -
RuntimeError: CUDA error (10): invalid device ordinal
在运行cuda程序时发生报错,出现 RuntimeError: CUDA error (10): invalid device ordinal 造成这个错误的原因主要是本地只有一个 GPU (GPU:0),而程序中使用 GPUs:1。在配置信息中,程序是1,我改成0就可以正常运行了。 ...原创 2018-11-30 14:33:36 · 9058 阅读 · 0 评论 -
Fine-Grained Head Pose Estimation Without Keypoints
头部姿态预估的算法论文地址:https://arxiv.org/pdf/1710.00925.pdfgithub源码地址:https://github.com/natanielruiz/deep-head-poseAbstract传统的头部姿态计算是通过从目标面部估计一些关键点,并用平均的人头模型解决2D到3D的对应问题。我们认为这种方法不好,很脆弱。因此,我们在数据集训练多损失卷...原创 2018-11-28 08:34:09 · 1450 阅读 · 1 评论 -
ResNet学习记录
1.首先电脑要安装linux,nvidia,cuda,cudnn,opencv,caffe2.prototxt网络结构可视化网站3.比较好的博客:https://www.cnblogs.com/denny402/p/5137534.html4.ResNet50的具体结构以下为安装过程,摘自博客:http://www.cnblogs.com/denny402/p/5067265.ht...原创 2018-12-05 08:40:24 · 491 阅读 · 0 评论 -
ubuntu安装cuda
ubuntu安装cuda装了三天才装好,太费劲了。主要分为这几步:1.安装英伟达显卡驱动,需要查找适合自己GPU的版本,其次在安装的时候,需要关闭图形界面Xserver,nouveau。https://blog.csdn.net/tianrolin/article/details/528304222.安装显卡驱动之后,再安装cuda。cuda也需要自己挑选版本。之后还要去/etc/...原创 2018-11-28 16:24:27 · 373 阅读 · 0 评论 -
Hyperface人脸检测算法
论文地址:《2016 PAMI HyperFace: A Deep Multi-task Learning Framework for Face Detection, Landmark Localization, Pose Estimation, and Gender Recognition.全文翻译有几处文意不同,后期慢慢进行修改。只是大体把主要步骤描述了一遍。 由深度学习完成...翻译 2018-11-15 21:40:51 · 1952 阅读 · 0 评论