音频处理
文章平均质量分 90
haima1998
这个作者很懒,什么都没留下…
展开
-
视频图片编辑工具
原创 2020-07-03 19:13:58 · 182 阅读 · 0 评论 -
视频PS神器!人物隐身、水印去除,简直像重拍了一遍,包含开源代码
转自:https://github.com/nbei/Deep-Flow-Guided-Video-Inpainting开源代码:https://github.com/nbei/Deep-Flow-Guided-Video-Inpainting文/鬼栗子 郭一璞 来源:量子位(ID:QbitAI) 让一个人的踪影从视频中消失,总是一个难题。 毕竟,你永远不知道,录好的节目...转载 2019-07-16 09:32:18 · 3836 阅读 · 0 评论 -
基于GB/T 28181 标准的监控摄像头视频接入技术
转自:https://cloud.tencent.com/developer/article/1383531在安防AI领域,遍布城市或建筑内各个角落的摄像头是最边缘的设备,是一切AI处理和应用的数据源头。随着应用范围和场景的扩充,应用中摄像头的数量越来越大,对监控摄像头设备进行集中且有效的管控成为刚需。GB/T 28181标准作为公共安全视频监控联网系统的国家标准,受到海康、大华、英飞拓等国内...转载 2019-07-15 17:46:34 · 17503 阅读 · 0 评论 -
NVIDIA VIDEO CODEC SDK
转自:https://developer.nvidia.com/nvidia-video-codec-sdkNVIDIA GPU 硬件decoder和encoder是独立于cuda coresNVIDIA GPUs contain one or morehardware-based decoder and encoder(s) (separate from the CUDA cores...转载 2019-07-11 11:29:10 · 1513 阅读 · 0 评论 -
H.264和H.265(HEVC)深度解析及对比
转自:https://www.twblogs.net/a/5c0aa7d7bd9eee6fb37bdc26/zh-cn一、什么是H.265H.265是ITU-TVCEG继H.264之后所制定的新的视频编码标准。H.265标准围绕着现有的视频编码标准H.264,保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最...转载 2019-07-15 15:48:29 · 1971 阅读 · 0 评论 -
语音识别研究的四大前沿方向
以下转自:http://blog.csdn.net/whaoxysh/article/details/19402337“ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题。当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。解决方案 斯坦福大学的Andrew N转载 2018-01-18 11:50:03 · 21519 阅读 · 0 评论 -
声音均衡器
以下转自:https://baike.baidu.com/item/%E5%A3%B0%E9%9F%B3%E5%9D%87%E8%A1%A1%E5%99%A8/10907330?fr=aladdin均衡器是一种可以分别调节各种频率成分电信号放大量的电子设备,通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源及其它特殊作用,一般调音台上的均衡器仅能对高频、中频、低频三段频率转载 2018-01-18 10:33:07 · 4422 阅读 · 0 评论 -
语音合成技术
转自:https://zhuanlan.zhihu.com/p/27395458语音合成又称文语转换(Text-To-Speech),简称TTS,指通过机械的、电子的方法生成语音的技术。随着科技的发展,合成语音的自然度和音质均得到了明显的改善。目前,语音合成技术在我们生活中具有广泛的应用,如电子阅读、车载语音导航、银行医院排号系统、交通播报等等,这些应用场景都离不开语音合成。转载 2017-11-24 09:17:39 · 6881 阅读 · 0 评论 -
不知道麦克风阵列是何方神圣?这篇文章告诉你!
转自:http://www.ikanchai.com/2016/0522/80416.shtml【城宇智能硬件】发布,砍柴网推荐,转载需注明上个世纪七八十年代,麦克风阵列技术已经开始应用到语音技术的研究中,2000年左右,业界开始慢慢深入,进行基于麦克风阵列相关算法的专题研究。到了物联网时代,市场的刺激和产品的需求,极大的推动了相关的技术进展,尤其是2014年亚马逊echo的正转载 2017-10-03 17:09:26 · 4311 阅读 · 0 评论 -
聊一聊麦克风阵列技术:语音交互应该选用怎样的方案?|深度
转自:https://www.leiphone.com/news/201610/BSlh3Kf6wcqNCRH9.html雷锋网按:本文作者陈孝良,工学博士,声智科技创始人。雷锋网(公众号:雷锋网)独家文章。亚马逊Echo和谷歌Home争奇斗艳,除了云端服务,他们在硬件上到底有哪些差异?我们先将Echo和Home两款音箱拆开来看,区别最大的还是麦克风阵列技术。Amazon Ec转载 2017-10-03 17:07:12 · 1438 阅读 · 0 评论 -
声音识别的 ImageNet 诞生了
转自:https://www.zhihu.com/question/56816282/answer/150639596谷歌机器感知研究小组(Machine Perception Research)最新发布了一个大规模的音频数据集AudioSet。根据谷歌在官网的介绍,AudioSet 包括 632 个音频事件类的扩展类目和从YouTube视频绘制的 2,084,320 个人类标记的10秒声转载 2017-10-01 15:40:31 · 1058 阅读 · 0 评论 -
声纹识别
转自:http://baike.baidu.com/link?url=nqH1CUbZvJFCAHY6j7y0eHbFVb_bUsIIyDqiegXzAHcoS0mJMMZODG0I4hm7vdwc_Zf0yxfvCzuvvfTc8bE7WCYeoxPnYY49GMsX0wo3NHp9f7RXn4HXBzOE4lcopsbG声纹识别,生物识别技术的一种。也称为说话人识别,有转载 2017-07-05 19:43:27 · 5139 阅读 · 0 评论 -
远场(far-field)语音识别的主流技术有哪些
转自:https://www.zhihu.com/question/48537863远场(far-field)语音识别的主流技术有哪些?以amazon echo为首的一批智能硬件正在崛起,这些硬件实现语音识别功能时面临的一个挑战性的问题就是如何降低远场麦克风造成的噪音(noise)、回声(reverberation)和自回声(echo),希望有大牛来介绍一下这个领域转载 2017-06-09 17:37:01 · 9853 阅读 · 0 评论 -
语音识别技术
1、语音识别原理1http://www.codeguru.com/cpp/g-m/multimedia/audio/article.php/c12363/How-Speech-Recognition-Works.htm2、语音识别原理2https://www.zhihu.com/question/203984183、语音识别系统原理介绍---从gmm-hmm到dnn-hmmht原创 2017-06-09 17:46:15 · 1361 阅读 · 0 评论