自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 2019年爱奇艺多模态视频人物识别挑战赛复盘

我们的团队在2018年的IQIYI竞赛中取得了第九名的成绩,今年,我们又继续参加了这一竞赛。在设计方案时,我们首先尝试了继续沿用去年的思路,即:从视频中按照一定的帧率抽取图片; 从图片中检测人脸并对齐; 提取人脸特征; 利用MLP进行人脸特征分类。这是一个只利用纯人脸特征进行分类的方案,但是这一方案在今年遇到了一些困难。按照今年的竞赛要求, 我们需要将测试工程打包成docker镜像,上...

2019-06-17 14:53:40 1469

原创 关于CNN行为识别算法的学习记录

最近需要做一点行为识别相关的项目,于是把行为识别类的算法(特别是基于CNN的算法)调研了一遍。到目前为止,CNN行为识别类的算法主要都是基于双流和3D卷积两种方法,近年来,融合使用光流和C3D的算法逐渐增多(I3D),也有的算法使用了如RGB Diffierence(TSN)或人体关节点等多模态的数据。评估行为识别算法主要使用的数据集包括:UCF-101:最通用的数据集,几乎所有论文都...

2018-10-18 15:31:28 7902

原创 可能用到的博客

一、NVIDIA JetsonTX2相关jetpack 3.3(或jetpack 4.2), 系统的备份与恢复, opencv+contrib 3.4.3(并配置python2、python3支持), pytorch 0.4.1(或更高版本)、torchvision, archiconda虚拟环境。1. jetpack刷机1.1 jetpack 3.3cuda 9.0...

2018-10-08 14:14:12 226

原创 caffe学习记录(四):如何配置caffe忽略掉某些不参与训练的标签

考虑MTCNN的训练场景,要求负样本只参与分类训练,而part样本只参与回归训练,正样本则要同时参与分类和回归训练,我们在数据集将不需要参与训练的部分标注为-1,如下图所示:但是,如果直接使用这样的数据集进行训练的话,这些label=-1的样本也会参与计算梯度,这样显然是不对的。那么,如何配置caffe使其忽略掉这些label=-1的数据呢?换句话说,我们需要caffe在回传梯度时将这...

2018-08-03 11:26:10 2552 1

原创 caffe学习记录(三):多标签分类/回归训练(下)

接上篇。我们已经为caffe添加了多标签分类训练功能,多标签分类的训练过程和单标签非常相似,同样包含以下几个步骤:一、准备多标签分类/回归训练的数据集(train.txt,val.txt,test.txt)这里我们以MTCNN人脸检测网络中的P-Net训练为例,P-Net需要同时输出人脸框的分类置信度(相当于一个二分类问题)和平移缩放参数(相当于一个回归问题),它的训练数据应该包含如下...

2018-08-03 10:44:20 2025 3

原创 caffe学习记录(二):多标签分类/回归训练(上)

多标签分类在工程上有很多应用,例如,输入一张图片,判断这个人的年龄、性别和是否配戴眼镜。这时,数据集的label文件应当具有这样的格式:000001.jpg 22 1 0 000002.jpg 30 1 1 000003.jpg 44 0 1 000004.jpg 17 0 0假定第一个数字表示年龄,第二个0/1表示女/男,第三个0/1表示不戴眼镜/戴眼镜。同样地,回归问题在CNN...

2018-07-13 18:21:34 2794 8

原创 caffe学习记录(一):单标签分类训练

参考博客:caffe学习系列:训练自己的图片集(超详细教程)按照这位dalao的博客走一遍,基本上可以解决caffe单标签训练的问题。我这里主要记录一下这个过程中需要注意的地方。caffe为单标签分类问题提供了很好的支持,很多操作都可以通过caffe提供的可执行文件来完成,这些可执行文件保存在caffe编译后生成的build/tools文件夹中。 一、准备训练数据这一步需要我们...

2018-07-13 15:53:09 2038

原创 C++实现客户端与服务器的通信(三):在远程服务器中处理本地摄像头数据

这次我们要走得稍微远一点,我需要直接从本地摄像头中读取视频流、传送到服务器、经过服务器上的dlib人脸检测算法、返回bounding box并在本地显示。不过,有了前面数据传输的基础,只要在合适的位置添加一些程序就可以了。一、图像的序列化当我们从摄像头中读取出Mat类型的图像数据(img)后,需要首先对其进行序列化使其能够在http下传输,需要借助opencv的imencode函数,程...

2018-07-10 19:27:27 3645 2

原创 C++实现客户端与服务器的通信(二):Base64编解码

关于base64编码,是网络上最常见的用于传输8Bit字节码的编码方式之一,base64就是一种基于64个可打印字符来表示二进制数据的方法,这里就不再赘述了。在HTTP环境中,常常需要将字符串转换为base64编码,这部分程序可以封装到两个函数当中,源码如下:一、base64.h和base64.cppbase64_encode:将BYTE *类型的字节流编码为string类型的base64字符串b...

2018-07-09 19:35:46 1189

原创 C++实现客户端与服务器的通信(一):利用Mongoose搭建一个http服务器

项目需求:将本地摄像头的数据发送到远程服务器上,经过服务器上的算法处理后,将结果返回本地并显示出来。然而,远程服务器是无法直接调用本地摄像头的数据的,要实现这一功能,只好在远程搭建一个http服务端,与本地的客户端通过curl进行通信。在实现这一功能之前,首先来实现一个相对简单的功能:在客户端以1s为间隔向服务端发送"Hello World!"并接收服务器的应答。一、服务端程序1. M...

2018-07-09 17:12:07 9778 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除