自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 关于主播表现能力的调研

基础指标:语速:单位时间内说话的字数流畅度:衡量方式可以通过句子的完整度。清晰度:是否可以通过语音识别的置信度音色:可能能够通过声音在频域上的分布来衡量,但是音色如何打标签,如何打分还需要调研。节奏感:语速有快有慢,声音的响度有高有底。直播间内主播说话是否有节奏感的差异在于5秒钟或者10秒内声音响度的变化次数需要大于一定的阈值。最好的展示方式应该是实时语音识别,并把响度变化明显的字highlight。感染力:我觉得有感染力的主播声音的音色不会太尖锐,声音的情绪饱满,语言流畅语速太

2022-03-28 17:21:04 1649

原创 虚拟达人调研

虚拟达人分为2类:超写实的虚拟艺人虚拟主播搜狗的新小萌等,新小微搜狗的3D AI合成主播“新小微”,并不是在此前2D合成主播的基础上升级迭代而来。陈伟在接受媒体采访时表示,2D的写实度比3D略高一些,但是3D的灵活性更高。基于路线探讨,搜狗还是区分了2D和3D,同时在底层算法上也做了充分的打通。技术拆分:背景知识计算机视觉:试图通过信号采集(摄像头),信号分析(机器学习)将世界抽象成知识。这有花,你很帅等等。典型应用:自动驾驶,刷脸计算机图形学(Computer Graphics,CG

2021-07-21 11:08:30 317 1

原创 ffmpeg总结

背景:服务器上已安装CUDA 10.0,配备2080Ti显卡,驱动是410.78。想要看能不能用GPU加速截帧,所以尝试编译ffmpeg的gpu版本,参考教程如下面的references中的一到五。第一次安装遇到了驱动版本低导致nv-codec-headers有问题。后更换nv-codec-headers重新编译,成功,成果如下:对视频进行转码,可以看到确实使用了GPU,命令:ffmpeg -i 6.mp4 -c:v h264_nvenc -c:a aac output.mp4但是对视.

2020-12-18 18:42:18 182

原创 数据标注

标注工具实习生使用labelImg标注数据,现成的可执行安装文件地址如下:https://pan.baidu.com/s/1SnAqrohg8JDYPUT6OuLUMg密码:k4sx目标检测标注注意事项1.检查图片先在本地检查图片,确保所有的图片能够使用lableImg打开;2.多类别标注时我自己习惯每次只标注一个类别,定义一个默认类别然后直接打标就好,但是要记得标注多个类别的数据的时候,同一张图片出现多个类别的时候需要多次标注。因此,就算按照类别给实习生分发任务,也要记得叮

2020-12-08 15:20:00 742 1

原创 Summary -------from the Hackathon

Q&AQ1.What if your hand or other organs are injured?A1.It depends on how much it is injured. I think our model is suitable for most cases.Q2.How fast it is?A2.In our device, about 47fps pe...

2020-03-06 09:44:25 182

原创 关于CV的一些思考

--------------------------------------------------------------------人脸识别----------------------------------------------------------------看到一段关于人脸识别的说明:人脸识别是基于人的脸部特征,首先对输入的图像判断存不存在人脸,如果存在人脸,给出人脸的位置和...

2020-03-06 09:43:45 186

原创 MTCNN和dlib的对比的说明

了解下误检率,以及如何降低误检率,针对HF的数据(240*180分辨率),MTCNN的检测能力而言是足够的,但是存在大量的误检测,且相比于dlib来说,依然有一些漏检存在,且仅比较漏检的话:MTCNN比DLIB并没有好很多(如果将对半张脸,即局部脸,例如眼睛/耳朵的检测不算的话)。具体情况如下:(数据有204张图片,大约有十几张是有两人存在的) ...

2020-03-06 09:43:26 649

原创 3D人脸

平均脸:mean-shapeBFM数据库的提出有效扩大了3DMM的适用场景,BFM可以拟合任意三维人脸并保存3DMM参数。有两个版本09版和17版,在这里只对17版(17版论文)进行说明。相比于09版,针对表情基进行了优化。BFM提供了一组形状,表情,纹理的基,且可以根据改变参数来改变人脸的年龄肥胖程度,其中形状基为一个199*n维的主成分,以及199*1维的主成分均方误差。纹理的基和形状...

2020-03-06 09:43:14 322

原创 重新思考人体姿态估计 Rethinking Human Pose Estimation

2D人体姿态识别比较有见底的文章:https://zhuanlan.zhihu.com/p/72561165

2020-03-06 09:42:34 198

原创 关于人脸识别项目

事宜日期 待做 备注 2019/05/25 (1)人脸比对的模型可以考虑由faceNet换成insightFace (2)MTCNN人脸检测器可以再重新训练 2019/06/10 (1)开发那边的图片有些不合格,不符合我这边的规则的时候,可以删掉这些图片,并且新增图片。 2019/06/11 (1)编码...

2020-03-06 09:41:41 579 1

转载 AI进入无障碍时代:手语识别翻译的应用意味着什么?

相信在人们的印象里,AI都是一个属于“大多数”的技术门类。所谓大多数,第一意味着相关数据量大、便于累积,适用于AI对海量数据极度依赖的特性;第二意味着应用场景广泛、便于变现回收成本,适用于AI研发的高门槛投入。目前我们身边常常出现的人脸识别、语音交互等等,其实都符合以上这些特征。不过这并不意味着,属于“少数派”的AI是一片空白。在“全球无障碍宣传日”这个特别的日子,我...

2019-11-04 13:43:14 563

原创 镜像源

-i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com #阿里云镜像-i https://pypi.tuna.tsinghua.edu.cn/simple #清华镜像

2019-09-23 15:18:53 108

原创 blender导出时没有纹理特征

https://jingyan.baidu.com/article/1709ad807cdfad4634c4f009.html

2019-08-27 15:05:15 4867

原创 几个经常忘记的linux终端常用命令

(1)查看文件大小:du -sh 路径例子:(1.1)查看根目录下的各个挂载点大小:df -h(2)对文件夹重新命名:mv old new例子:将文件夹“yy"重新命名为"face"mv yy face(3)查看该目录下,文件夹或者文件的个数:仅这一个目录下的:ls | wc -w或者ls | wc -l查看最后一层目录下文件数:ls -lR | grep...

2019-06-03 13:57:44 176

原创 windows下训练yolov2和yolov3

YOLO on windows1.What do you need?1.1 A compute with Nvidia Graphic Unit will speed the whole process a lot; else, it may take you several days to get your model well trained. Try yolo-tiny inste...

2018-08-23 14:42:26 1464

原创 linux下以动态链接打包项目进行移植

写在前面:在ubuntu上训练了YOLO,现在需要把这个项目一直到另一台电脑(同ubuntu 16.04),不想配置环境吧啦吧啦的,所以想把YOLO整体打包移植。训练YOLO 生物这台电脑有Nvidia Quadro P4000显卡,而要接受该移植的电脑则没有独立显卡!因此,不打包CUDA,cudnn,则不需要考虑不同显卡支持的驱动版本以及CUDA版本等问题。需要的:opencv、YOLO...

2018-07-31 21:59:48 571

原创 用自己的数据训练yolov3

Train YOLO V3 with my own dataOperating System: Linux on Ubuntu with CUDA 8.0 & OPENCV 3.2.0Since YOLO V3 has a better performance on small objection detection, and we add a new class—wrist...

2018-07-31 09:39:32 1669

原创 Video test by YOLO trained by my own data

(1) Data preparationWith the help of LabelImg, I labeled 858 pictures with the feature hand, so I got 858 annotation files. Before I started to label, I renamed all 858 pictures, and the new names...

2018-07-02 15:33:47 229

原创 Ubuntu下用自己的数据训练yolov2

Train yolov2 with my own dataOperating system: Linux on Ubuntu.Tools: LabelImg , the operation method can be find in README.rst.Step 1 .Download darknet According to the linked web, down...

2018-06-07 14:56:40 819

rolabelImg.exe

LabelImg的升级版本,可标注带角度的框;如遇到下载问题,可私信免费获取资源,仅供交流使用,如有侵权,即刻删除。源代码地址:https://github.com/cgvict/roLabelImg/blob/master/README.rst

2020-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除