音频技术
幻雪神界
专业: 电子科学与技术(微电子,集成电路设计),工业工程
工作背景: 国企,法企,美企,德企,私企,创业公司
擅长领域: 芯片设计,MCU/ARM/FPGA, Linux, Android, WebRTC, WSN, iOT等领域
产品领域: 手机基带芯片,手机,智能电视,智能投影,新能源汽车,智能家居等产品
展开
-
常用音频协议介绍
会议电视常用音频协议介绍及对比白皮书 一、数字化音频原理:声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。通常人耳可以听到的频率在20Hz到20KHz的声波称为为可听声,低于20Hz的成为次声,高于20KHz的为超声,多媒体技术中只研究可听声部分。 可听声中,话音信号的频段在80Hz到3400Hz之间,音乐信号的频段在20Hz-20kHz之转载 2012-09-16 23:37:53 · 796 阅读 · 0 评论 -
解密回声消除技术之一(理论篇)
一、前言因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里面,回声转载 2013-05-28 21:01:42 · 945 阅读 · 0 评论 -
Alsa 小结
ALSA小结,从网上转载的,不知道原来的地址了 关于alsa的总结:一. alsa展现的三层结构:(1)audio interface:audio interface就是声卡,它含有hardware buffer,注意,这个hardware buffer是在声卡里面,不是内存。(2)computer:这个指的是计算机的内核和驱动(驱动由alsa提供),当(1)的audi转载 2013-02-01 20:17:13 · 635 阅读 · 0 评论 -
常用视频音频编码简介
常用视频音频编码简介这里只对常见的视频音频编码做一个系统的简单介绍,并不进行详细探讨。由于我的知识有限,难免有错误的地方,欢迎来信指正。MPEG 系列:MPEG 即(Moving Pictures Experts Group) 运动图象专家组,属于ISO(International Organization for Standardization) 国际标准组织,他们开转载 2012-09-18 15:11:39 · 859 阅读 · 0 评论 -
有关音频编码的知识与技术参数(转载)
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。1、什么是采样率和采样大小(位/bit)? 声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线转载 2012-09-18 15:04:24 · 1150 阅读 · 1 评论 -
srilm编译
Srilm的全称是Stanford Research Institute Language Modeling Toolkit 他被用来构建和应用统计语言模型,主要用于语音识别,统计标注和切分,以及机器翻译等工作。ubuntu编译,可以再52nlp中去找。VC编译,可以再下面链接找,http://www.keithv.com/software/srilm/以VS2008为例,可以转载 2012-09-18 15:00:29 · 609 阅读 · 0 评论 -
wav文件的文件头
wav文件的文件头wave文件的格式:00H 4 char "RIFF"标志 04H 4 long int 文件长度 08H 4 char "WAVE"标志 0CH 4 char "fmt"标志 10H 4 过渡字节(不定) 14H 2 int 格式类别(10H为PCM形式的声音数据) 16H 2 int 通道数,单声道为1,双声道为2 18H转载 2012-09-18 14:50:22 · 1109 阅读 · 0 评论 -
语音质量评价
语音作为信息传递的重要载体,与其相关构成的通信、编码、存储和处理等语音系统已成为现代社会信息交流的必要手段,且已广泛应用于社会各个领域。这些系统的性能好坏成为信息交流是否畅通的重要因素,而评价这些系统性能优劣的根本标志是在于系统输出语音质量的好坏。因此,研制灵活、方便、可靠的语音质量评价系统自然成为国内外研究者共同努力的目标。 语音质量包括两方面内容:清晰度和自然度。前者是衡量语转载 2012-09-18 14:54:47 · 2464 阅读 · 0 评论 -
语谱图
转自:http://blog.csdn.net/jiangyangbo/article/details/5899264[y1,fs,nbits] = wavread('D:/data/sp01.wav'); //语音文件自己修改figure(1);specgram(y1,256,8000,256,128);title('sp01');x = y1;nfft = 256;转载 2012-09-18 14:43:28 · 1306 阅读 · 0 评论 -
AAC 音频
AAC,即高级音频编码(Advanced Audio Coding),它是由MP3专利的拥有者Fraunhofer IIS联合杜比、AT&T、索尼、苹果等产业巨头共同开发出的一种数字音频压缩方式。开发这种音频编码的主要目的就是为了取代MP3现有的地位。其实,AAC的技术早在1997年就成型了,当时被称为MPEG-2 AAC,但是随着2000年MPEG-4音频标准的出台,MPEG-2 AAC被用转载 2012-09-18 15:02:52 · 686 阅读 · 0 评论 -
音量的计算
音量又称响度、音强,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。音量的计算1,声音数据data,长度为len方法1,音量为声音的最大值减去最转载 2012-09-18 14:38:18 · 742 阅读 · 0 评论 -
比特率
一、计算机中的比特率比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大。比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好相反。计算转载 2012-09-18 15:09:12 · 1524 阅读 · 0 评论 -
matlab toolbox(audio)
Audio PQevalAudio [options] AFileR AFileThttp://www.tsp.ece.mcgill.ca/MMSP/Documents/Software/Packages/AFsp/PQevalAudio.htmlTTSBOX: A MATLAB TOOLBOX FOR TEACHING TEXT-TO-SPEECH SYNTHES转载 2012-09-18 14:59:03 · 2128 阅读 · 0 评论 -
专业音响知识
JBL扬声器 扬声器(简称音箱)是音响系统的喉舌,直接影响还音的音质,是音响系统最关健的部份。它如像歌星的嗓子,有了好的歌喉,才能唱出优美动听的歌曲。因此,如何选择好声音宏亮、音质优美、失真极微、工作可靠的扬声器是广大用户共同关心和追求的目标。JBL作为专业扬声器生产商的先驱者,我们有责任向大家介绍。一)如何选择扬声器? 扬声器实际上是一种把可听范围内的音频电功率信号通过换能器转载 2012-09-17 17:17:57 · 7978 阅读 · 0 评论 -
语音聊天所涉及的技术
当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时,我们可曾想过其背后有哪些强大的技术在支撑?本文将对网络语音通话所使用到的技术做一些简单的介绍,算是管中窥豹吧。一.概念模型网络语音通话通常是双向的,就模型层面来说,这个双向是对称的。为了简单起见,我们讨论一个方向的通道就可以了。一方说话,另一方则听到声音。看似简单而迅捷,但是其背后的流程却是相当复杂的。我们将其经转载 2013-05-28 21:06:59 · 1072 阅读 · 0 评论