wwww1244-CSDN博客

原创 2019年爱奇艺多模态视频人物识别挑战赛复盘

我们的团队在2018年的IQIYI竞赛中取得了第九名的成绩，今年，我们又继续参加了这一竞赛。在设计方案时，我们首先尝试了继续沿用去年的思路，即：从视频中按照一定的帧率抽取图片；从图片中检测人脸并对齐；提取人脸特征；利用MLP进行人脸特征分类。这是一个只利用纯人脸特征进行分类的方案，但是这一方案在今年遇到了一些困难。按照今年的竞赛要求，我们需要将测试工程打包成docker镜像，上...

2019-06-17 14:53:40 1489

原创关于CNN行为识别算法的学习记录

最近需要做一点行为识别相关的项目，于是把行为识别类的算法（特别是基于CNN的算法）调研了一遍。到目前为止，CNN行为识别类的算法主要都是基于双流和3D卷积两种方法，近年来，融合使用光流和C3D的算法逐渐增多（I3D），也有的算法使用了如RGB Diffierence（TSN）或人体关节点等多模态的数据。评估行为识别算法主要使用的数据集包括：UCF-101：最通用的数据集，几乎所有论文都...

2018-10-18 15:31:28 7951

原创可能用到的博客

一、NVIDIA JetsonTX2相关jetpack 3.3（或jetpack 4.2），系统的备份与恢复， opencv+contrib 3.4.3（并配置python2、python3支持）， pytorch 0.4.1（或更高版本）、torchvision， archiconda虚拟环境。1. jetpack刷机1.1 jetpack 3.3cuda 9.0...

2018-10-08 14:14:12 239

原创 caffe学习记录(四)：如何配置caffe忽略掉某些不参与训练的标签

考虑MTCNN的训练场景，要求负样本只参与分类训练，而part样本只参与回归训练，正样本则要同时参与分类和回归训练，我们在数据集将不需要参与训练的部分标注为-1，如下图所示：但是，如果直接使用这样的数据集进行训练的话，这些label=-1的样本也会参与计算梯度，这样显然是不对的。那么，如何配置caffe使其忽略掉这些label=-1的数据呢？换句话说，我们需要caffe在回传梯度时将这...

2018-08-03 11:26:10 2567 1

原创 caffe学习记录(三)：多标签分类/回归训练(下)

接上篇。我们已经为caffe添加了多标签分类训练功能，多标签分类的训练过程和单标签非常相似，同样包含以下几个步骤：一、准备多标签分类/回归训练的数据集（train.txt，val.txt，test.txt）这里我们以MTCNN人脸检测网络中的P-Net训练为例，P-Net需要同时输出人脸框的分类置信度（相当于一个二分类问题）和平移缩放参数（相当于一个回归问题），它的训练数据应该包含如下...

2018-08-03 10:44:20 2037 3

原创 caffe学习记录(二)：多标签分类/回归训练(上)

多标签分类在工程上有很多应用，例如，输入一张图片，判断这个人的年龄、性别和是否配戴眼镜。这时，数据集的label文件应当具有这样的格式：000001.jpg 22 1 0 000002.jpg 30 1 1 000003.jpg 44 0 1 000004.jpg 17 0 0假定第一个数字表示年龄，第二个0/1表示女/男，第三个0/1表示不戴眼镜/戴眼镜。同样地，回归问题在CNN...

2018-07-13 18:21:34 2813 8

原创 caffe学习记录(一)：单标签分类训练

参考博客：caffe学习系列：训练自己的图片集（超详细教程）按照这位dalao的博客走一遍，基本上可以解决caffe单标签训练的问题。我这里主要记录一下这个过程中需要注意的地方。caffe为单标签分类问题提供了很好的支持，很多操作都可以通过caffe提供的可执行文件来完成，这些可执行文件保存在caffe编译后生成的build/tools文件夹中。一、准备训练数据这一步需要我们...

2018-07-13 15:53:09 2051

原创 C++实现客户端与服务器的通信(三)：在远程服务器中处理本地摄像头数据

这次我们要走得稍微远一点，我需要直接从本地摄像头中读取视频流、传送到服务器、经过服务器上的dlib人脸检测算法、返回bounding box并在本地显示。不过，有了前面数据传输的基础，只要在合适的位置添加一些程序就可以了。一、图像的序列化当我们从摄像头中读取出Mat类型的图像数据（img）后，需要首先对其进行序列化使其能够在http下传输，需要借助opencv的imencode函数，程...

2018-07-10 19:27:27 3662 2

原创 C++实现客户端与服务器的通信(二)：Base64编解码

关于base64编码，是网络上最常见的用于传输8Bit字节码的编码方式之一，base64就是一种基于64个可打印字符来表示二进制数据的方法，这里就不再赘述了。在HTTP环境中，常常需要将字符串转换为base64编码，这部分程序可以封装到两个函数当中，源码如下：一、base64.h和base64.cppbase64_encode：将BYTE *类型的字节流编码为string类型的base64字符串b...

2018-07-09 19:35:46 1205

原创 C++实现客户端与服务器的通信(一)：利用Mongoose搭建一个http服务器

项目需求：将本地摄像头的数据发送到远程服务器上，经过服务器上的算法处理后，将结果返回本地并显示出来。然而，远程服务器是无法直接调用本地摄像头的数据的，要实现这一功能，只好在远程搭建一个http服务端，与本地的客户端通过curl进行通信。在实现这一功能之前，首先来实现一个相对简单的功能：在客户端以1s为间隔向服务端发送"Hello World!"并接收服务器的应答。一、服务端程序1. M...

2018-07-09 17:12:07 9872 6

wwww1244的博客