hust_zhengT-CSDN博客

原创基于MTCNN和MobileFaceNet的人脸识别

项目描述：本项目的主要目标是基于NCNN和Opencv库，实现MTCNN人脸检测和对齐，得到人脸之后，再调用预训练的MobileFaceNet模型进行人脸识别，并用Opencv实现项目可视化和人机交互功能。通过调用摄像头，用户可以自行拍照并保存照片，之后软件会自动对图片进行人脸检测和对齐处理，并返回前后两张照片的相似度，实现人脸识别。使用ncnn的原因是为了提升在移动设备的运行效率。 Figure 1. 程序操作流程项目框架：Header file: mtcnn.h Cpp file: main.

2021-02-01 16:52:39 1742

原创（补发）多模态文献阅读周记（一）——2020/06/08-2020/06/12

Week Literature Reading Report2020/06/08-2020/06/12 week 1Paper 1Tensor Fusion Network for Multimodal Sentiment AnalysisIssues that need resolvingMultimodal fusion and representationKey insightThis paper use three-fold Cartesian product to fusion t

2020-08-14 17:12:10 1064

原创 Speech Recognition with Multi-Task论文精读系列（二）基于多任务的电话中心的客户满意度估计

Customer Satisfaction Estimation in Contact Center Calls Based on a Hierarchical Multi-Task ModelAtsushi Ando , Ryo Masumura, Hosana Kamiyama, Satoshi Kobashikawa, Yushi Aono, and Tomoki Toda关于文章IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROC

2020-08-14 15:39:49 460

原创 Speech Recognition with Multi-Task论文精读系列（一）多任务VS对抗学习

Multi-Task VS Adversarial Learning: To Reverse the Gradient or Not an Empirical Comparison of Adversarial and Multi-task Learning in Speech Recognition前言关于文章和作者主要内容模型结构、Loss函数Adversarial LearningMulti-Task Learning实验结果、结论前言从今天开始要持续更新一个新的系列了——多任务学习在语音识别中的

2020-08-13 17:18:50 1175

原创 Multimodal——Paper简读笔记：Multimodal Image-to-Image Translation via a Single Generative Adversarial Net

Multimodal Image-to-Image Translation via a Single Generative Adversarial NetworkShihua Huang, Cheng He, Ran Cheng文章简介三位作者均来自南方科技大学计算机系，这篇文章从哪里来的？我真不记得了，也就几天前的事吧，因为订阅了很多谷歌学者以及公众号，每天推送很多文章，实在想不起来在什么地方看到的这篇。谷歌了一下，目前也只是在arXiv上传了，估计是投了什么会议，还没有出结果吧。而且，我突然间发现

2020-08-12 12:58:18 593

原创 Multimodal——Paper精读笔记：A Hierarchical Multimodal Attention-based Human Activity Recognition Algorithm

HAMLET： A Hierarchical Multimodal Attention-based Human Activity Recognition AlgorithmMd Mofijul Islam, Tariq Iqbal文章简介：两位作者均来自美国弗吉尼亚大学，系统与环境工程学院。Email: {mi8uu,tiqbal}@virginia.edu文章中了IEEE-IROS 2020，机器人领域四大顶会之一。问题情景：Human activity recognition(HAR)，在

2020-08-11 15:47:58 783 1

原创 Multimodal——Paper精读笔记：Improving Vision-and-Language Navigation with Image-Text Pairs from the Web

Improving Vision-and-Language Navigation with Image-Text Pairs from the Web关键字：BERT、迁移学习、预训练文章简介这篇文章中了今年ECCV（2020），还是spotlight，挺牛X的了。虽然还是吃的transformer的老本（自从出现了transformer，多模态领域就像找到了突破点一样，各种使用transformer，因此也是在各大会议发了不少文章，去年和今年几乎所有的多模态文章都是基于transformer的），但

2020-08-11 12:57:31 681

原创科研笔记----七月总结

六月四号是正式开始科研的第一天，刚开始科研，脑袋一片空白，老师也没有跟我交代太多，就让我看了一篇multimodal的综述文章，然后写一篇report交给他。由于疫情的原因，这篇综述看了几个月，然而也并没有看出什么有价值东西。科研的起步阶段是很枯燥的，而且很可能花了不少时间却义务所获，所以学会正确的方式是很重要的。之后在知乎上看到了一篇经验贴，是曼大的一位计算机专业在读博士的经验分享贴（https://www.zhihu.com/question/21278186/answer/724440797？utm

2020-08-01 12:37:58 640

mobileFacenet-ncnn-update-mobilefacenet-ncnn.rar

2021-02-01

硬件课设——电子罗盘实验报告

电信学院硬件课设结题报告，主要是陀螺仪模块的内容。

2016-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人