shine_6088-CSDN博客

原创关于主播表现能力的调研

基础指标：语速：单位时间内说话的字数流畅度：衡量方式可以通过句子的完整度。清晰度：是否可以通过语音识别的置信度音色：可能能够通过声音在频域上的分布来衡量，但是音色如何打标签，如何打分还需要调研。节奏感：语速有快有慢，声音的响度有高有底。直播间内主播说话是否有节奏感的差异在于5秒钟或者10秒内声音响度的变化次数需要大于一定的阈值。最好的展示方式应该是实时语音识别，并把响度变化明显的字highlight。感染力：我觉得有感染力的主播声音的音色不会太尖锐，声音的情绪饱满，语言流畅语速太

2022-03-28 17:21:04 1693

原创虚拟达人调研

虚拟达人分为2类：超写实的虚拟艺人虚拟主播搜狗的新小萌等，新小微搜狗的3D AI合成主播“新小微”，并不是在此前2D合成主播的基础上升级迭代而来。陈伟在接受媒体采访时表示，2D的写实度比3D略高一些，但是3D的灵活性更高。基于路线探讨，搜狗还是区分了2D和3D，同时在底层算法上也做了充分的打通。技术拆分：背景知识计算机视觉：试图通过信号采集（摄像头），信号分析（机器学习）将世界抽象成知识。这有花，你很帅等等。典型应用：自动驾驶，刷脸计算机图形学（Computer Graphics，CG

2021-07-21 11:08:30 586 1

原创 ffmpeg总结

背景：服务器上已安装CUDA 10.0，配备2080Ti显卡，驱动是410.78。想要看能不能用GPU加速截帧，所以尝试编译ffmpeg的gpu版本，参考教程如下面的references中的一到五。第一次安装遇到了驱动版本低导致nv-codec-headers有问题。后更换nv-codec-headers重新编译，成功，成果如下：对视频进行转码，可以看到确实使用了GPU，命令：ffmpeg -i 6.mp4 -c:v h264_nvenc -c:a aac output.mp4但是对视.

2020-12-18 18:42:18 212

原创数据标注

标注工具实习生使用labelImg标注数据，现成的可执行安装文件地址如下：https://pan.baidu.com/s/1SnAqrohg8JDYPUT6OuLUMg密码：k4sx目标检测标注注意事项1.检查图片先在本地检查图片，确保所有的图片能够使用lableImg打开；2.多类别标注时我自己习惯每次只标注一个类别，定义一个默认类别然后直接打标就好，但是要记得标注多个类别的数据的时候，同一张图片出现多个类别的时候需要多次标注。因此，就算按照类别给实习生分发任务，也要记得叮

2020-12-08 15:20:00 786 1

原创 Summary -------from the Hackathon

Q&AQ1.What if your hand or other organs are injured?A1.It depends on how much it is injured. I think our model is suitable for most cases.Q2.How fast it is?A2.In our device, about 47fps pe...

2020-03-06 09:44:25 208

原创关于CV的一些思考

--------------------------------------------------------------------人脸识别----------------------------------------------------------------看到一段关于人脸识别的说明：人脸识别是基于人的脸部特征，首先对输入的图像判断存不存在人脸，如果存在人脸，给出人脸的位置和...

2020-03-06 09:43:45 215

原创 MTCNN和dlib的对比的说明

了解下误检率，以及如何降低误检率，针对HF的数据（240*180分辨率），MTCNN的检测能力而言是足够的，但是存在大量的误检测，且相比于dlib来说，依然有一些漏检存在，且仅比较漏检的话：MTCNN比DLIB并没有好很多（如果将对半张脸，即局部脸，例如眼睛/耳朵的检测不算的话）。具体情况如下：（数据有204张图片，大约有十几张是有两人存在的） ...

2020-03-06 09:43:26 696

原创 3D人脸

平均脸：mean-shapeBFM数据库的提出有效扩大了3DMM的适用场景，BFM可以拟合任意三维人脸并保存3DMM参数。有两个版本09版和17版，在这里只对17版（17版论文）进行说明。相比于09版，针对表情基进行了优化。BFM提供了一组形状，表情，纹理的基，且可以根据改变参数来改变人脸的年龄肥胖程度，其中形状基为一个199*n维的主成分，以及199*1维的主成分均方误差。纹理的基和形状...

2020-03-06 09:43:14 334

原创重新思考人体姿态估计 Rethinking Human Pose Estimation

2D人体姿态识别比较有见底的文章：https://zhuanlan.zhihu.com/p/72561165

2020-03-06 09:42:34 212

原创关于人脸识别项目

事宜日期待做备注 2019/05/25 (1)人脸比对的模型可以考虑由faceNet换成insightFace (2)MTCNN人脸检测器可以再重新训练 2019/06/10 (1)开发那边的图片有些不合格，不符合我这边的规则的时候，可以删掉这些图片，并且新增图片。 2019/06/11 (1)编码...

2020-03-06 09:41:41 634 1

转载 AI进入无障碍时代：手语识别翻译的应用意味着什么？

相信在人们的印象里，AI都是一个属于“大多数”的技术门类。所谓大多数，第一意味着相关数据量大、便于累积，适用于AI对海量数据极度依赖的特性；第二意味着应用场景广泛、便于变现回收成本，适用于AI研发的高门槛投入。目前我们身边常常出现的人脸识别、语音交互等等，其实都符合以上这些特征。不过这并不意味着，属于“少数派”的AI是一片空白。在“全球无障碍宣传日”这个特别的日子，我...

2019-11-04 13:43:14 606

原创镜像源

-i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com #阿里云镜像-i https://pypi.tuna.tsinghua.edu.cn/simple #清华镜像

2019-09-23 15:18:53 125

原创 blender导出时没有纹理特征

https://jingyan.baidu.com/article/1709ad807cdfad4634c4f009.html

2019-08-27 15:05:15 5006

原创几个经常忘记的linux终端常用命令

（1）查看文件大小：du -sh 路径例子：(1.1)查看根目录下的各个挂载点大小：df -h（2）对文件夹重新命名：mv old new例子：将文件夹“yy"重新命名为"face"mv yy face（3）查看该目录下，文件夹或者文件的个数：仅这一个目录下的：ls | wc -w或者ls | wc -l查看最后一层目录下文件数：ls -lR | grep...

2019-06-03 13:57:44 205

原创 windows下训练yolov2和yolov3

YOLO on windows1.What do you need?1.1 A compute with Nvidia Graphic Unit will speed the whole process a lot; else, it may take you several days to get your model well trained. Try yolo-tiny inste...

2018-08-23 14:42:26 1500

原创 linux下以动态链接打包项目进行移植

写在前面：在ubuntu上训练了YOLO，现在需要把这个项目一直到另一台电脑（同ubuntu 16.04），不想配置环境吧啦吧啦的，所以想把YOLO整体打包移植。训练YOLO 生物这台电脑有Nvidia Quadro P4000显卡，而要接受该移植的电脑则没有独立显卡！因此，不打包CUDA，cudnn，则不需要考虑不同显卡支持的驱动版本以及CUDA版本等问题。需要的：opencv、YOLO...

2018-07-31 21:59:48 600

原创用自己的数据训练yolov3

Train YOLO V3 with my own dataOperating System: Linux on Ubuntu with CUDA 8.0 & OPENCV 3.2.0Since YOLO V3 has a better performance on small objection detection, and we add a new class—wrist...

2018-07-31 09:39:32 1687

原创 Video test by YOLO trained by my own data

(1) Data preparationWith the help of LabelImg, I labeled 858 pictures with the feature hand, so I got 858 annotation files. Before I started to label, I renamed all 858 pictures, and the new names...

2018-07-02 15:33:47 255

原创 Ubuntu下用自己的数据训练yolov2

Train yolov2 with my own dataOperating system: Linux on Ubuntu.Tools: LabelImg , the operation method can be find in README.rst.Step 1 .Download darknet According to the linked web, down...

2018-06-07 14:56:40 826

shine_6088的博客