![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
工具
shine_6088
这个作者很懒,什么都没留下…
展开
-
关于主播表现能力的调研
基础指标:语速:单位时间内说话的字数流畅度:衡量方式可以通过句子的完整度。清晰度:是否可以通过语音识别的置信度音色:可能能够通过声音在频域上的分布来衡量,但是音色如何打标签,如何打分还需要调研。节奏感:语速有快有慢,声音的响度有高有底。直播间内主播说话是否有节奏感的差异在于5秒钟或者10秒内声音响度的变化次数需要大于一定的阈值。最好的展示方式应该是实时语音识别,并把响度变化明显的字highlight。感染力:我觉得有感染力的主播声音的音色不会太尖锐,声音的情绪饱满,语言流畅语速太原创 2022-03-28 17:21:04 · 1654 阅读 · 0 评论 -
数据标注
标注工具实习生使用labelImg标注数据,现成的可执行安装文件地址如下:https://pan.baidu.com/s/1SnAqrohg8JDYPUT6OuLUMg密码:k4sx目标检测标注注意事项1.检查图片先在本地检查图片,确保所有的图片能够使用lableImg打开;2.多类别标注时我自己习惯每次只标注一个类别,定义一个默认类别然后直接打标就好,但是要记得标注多个类别的数据的时候,同一张图片出现多个类别的时候需要多次标注。因此,就算按照类别给实习生分发任务,也要记得叮原创 2020-12-08 15:20:00 · 748 阅读 · 1 评论 -
ffmpeg总结
背景:服务器上已安装CUDA 10.0,配备2080Ti显卡,驱动是410.78。想要看能不能用GPU加速截帧,所以尝试编译ffmpeg的gpu版本,参考教程如下面的references中的一到五。第一次安装遇到了驱动版本低导致nv-codec-headers有问题。后更换nv-codec-headers重新编译,成功,成果如下:对视频进行转码,可以看到确实使用了GPU,命令:ffmpeg -i 6.mp4 -c:v h264_nvenc -c:a aac output.mp4但是对视.原创 2020-12-18 18:42:18 · 183 阅读 · 0 评论 -
linux下以动态链接打包项目进行移植
写在前面:在ubuntu上训练了YOLO,现在需要把这个项目一直到另一台电脑(同ubuntu 16.04),不想配置环境吧啦吧啦的,所以想把YOLO整体打包移植。训练YOLO 生物这台电脑有Nvidia Quadro P4000显卡,而要接受该移植的电脑则没有独立显卡!因此,不打包CUDA,cudnn,则不需要考虑不同显卡支持的驱动版本以及CUDA版本等问题。需要的:opencv、YOLO...原创 2018-07-31 21:59:48 · 571 阅读 · 0 评论 -
blender导出时没有纹理特征
https://jingyan.baidu.com/article/1709ad807cdfad4634c4f009.html原创 2019-08-27 15:05:15 · 4889 阅读 · 0 评论