自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (2)
  • 收藏
  • 关注

原创 基于MTCNN和MobileFaceNet的人脸识别

项目描述:本项目的主要目标是基于NCNN和Opencv库,实现MTCNN人脸检测和对齐,得到人脸之后,再调用预训练的MobileFaceNet模型进行人脸识别,并用Opencv实现项目可视化和人机交互功能。通过调用摄像头,用户可以自行拍照并保存照片,之后软件会自动对图片进行人脸检测和对齐处理,并返回前后两张照片的相似度,实现人脸识别。使用ncnn的原因是为了提升在移动设备的运行效率。 Figure 1. 程序操作流程项目框架:Header file: mtcnn.h Cpp file: main.

2021-02-01 16:52:39 1540

原创 (补发)多模态文献阅读周记(一)——2020/06/08-2020/06/12

Week Literature Reading Report2020/06/08-2020/06/12 week 1Paper 1Tensor Fusion Network for Multimodal Sentiment AnalysisIssues that need resolvingMultimodal fusion and representationKey insightThis paper use three-fold Cartesian product to fusion t

2020-08-14 17:12:10 969

原创 Speech Recognition with Multi-Task论文精读系列(二)基于多任务的电话中心的客户满意度估计

Customer Satisfaction Estimation in Contact Center Calls Based on a Hierarchical Multi-Task ModelAtsushi Ando , Ryo Masumura, Hosana Kamiyama, Satoshi Kobashikawa, Yushi Aono, and Tomoki Toda关于文章IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROC

2020-08-14 15:39:49 324

原创 Speech Recognition with Multi-Task论文精读系列(一)多任务VS对抗学习

Multi-Task VS Adversarial Learning: To Reverse the Gradient or Not an Empirical Comparison of Adversarial and Multi-task Learning in Speech Recognition前言关于文章和作者主要内容模型结构、Loss函数Adversarial LearningMulti-Task Learning实验结果、结论前言从今天开始要持续更新一个新的系列了——多任务学习在语音识别中的

2020-08-13 17:18:50 783

原创 Multimodal——Paper简读笔记:Multimodal Image-to-Image Translation via a Single Generative Adversarial Net

Multimodal Image-to-Image Translation via a Single Generative Adversarial NetworkShihua Huang, Cheng He, Ran Cheng文章简介三位作者均来自南方科技大学计算机系,这篇文章从哪里来的?我真不记得了,也就几天前的事吧,因为订阅了很多谷歌学者以及公众号,每天推送很多文章,实在想不起来在什么地方看到的这篇。谷歌了一下,目前也只是在arXiv上传了,估计是投了什么会议,还没有出结果吧。而且,我突然间发现

2020-08-12 12:58:18 493

原创 Multimodal——Paper精读笔记:A Hierarchical Multimodal Attention-based Human Activity Recognition Algorithm

HAMLET: A Hierarchical Multimodal Attention-based Human Activity Recognition AlgorithmMd Mofijul Islam, Tariq Iqbal文章简介:两位作者均来自美国弗吉尼亚大学,系统与环境工程学院。Email: {mi8uu,tiqbal}@virginia.edu文章中了IEEE-IROS 2020,机器人领域四大顶会之一。问题情景:Human activity recognition(HAR),在

2020-08-11 15:47:58 650 1

原创 Multimodal——Paper精读笔记:Improving Vision-and-Language Navigation with Image-Text Pairs from the Web

Improving Vision-and-Language Navigation with Image-Text Pairs from the Web关键字:BERT、迁移学习、预训练文章简介这篇文章中了今年ECCV(2020),还是spotlight,挺牛X的了。虽然还是吃的transformer的老本(自从出现了transformer,多模态领域就像找到了突破点一样,各种使用transformer,因此也是在各大会议发了不少文章,去年和今年几乎所有的多模态文章都是基于transformer的),但

2020-08-11 12:57:31 544

原创 科研笔记----七月总结

六月四号是正式开始科研的第一天,刚开始科研,脑袋一片空白,老师也没有跟我交代太多,就让我看了一篇multimodal的综述文章,然后写一篇report交给他。由于疫情的原因,这篇综述看了几个月,然而也并没有看出什么有价值东西。科研的起步阶段是很枯燥的,而且很可能花了不少时间却义务所获,所以学会正确的方式是很重要的。之后在知乎上看到了一篇经验贴,是曼大的一位计算机专业在读博士的经验分享贴(https://www.zhihu.com/question/21278186/answer/724440797?utm

2020-08-01 12:37:58 520

mobileFacenet-ncnn-update-mobilefacenet-ncnn.rar

mobileFacenet-ncnn-update-mobilefacenet-ncnn.rar

2021-02-01

硬件课设——电子罗盘实验报告

电信学院硬件课设结题报告,主要是陀螺仪模块的内容。

2016-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除