多媒体--音频
junllee
这个作者很懒,什么都没留下…
展开
-
动态范围压缩,得到绝佳音质的好选择
<br />如果谈资论辈,似乎再也没有像“动态范围压缩”这样堂而皇之地人为制造失真,反而受到好评的例子了!当然,除非你是狂热的音响“发烧友”,对声音质量绝不妥协。<br /> <br /> 更多的时候,你会权衡面积、器件成本、设计成本等因素,转而对动态范围压缩抛出橄榄枝。而TI首款具有动态范围压缩功能的立体声D类放大器的推出似乎也是情理之中的事情。<br /> <br /> 平常我们所说的动态范围是最强声音与最弱声音的强度差,单位用“db” 表示(即20Log10(P/Po))。一般语言的动态范围转载 2010-12-12 14:57:00 · 14664 阅读 · 0 评论 -
ASoC – ALSA for System on Chip Devices
TheALSA System on Chip (ASoC) framework is the embedded Linux kernel sound system. ASoC is targeted at SoC processors and is designed with embedded system features in mind. ASoC provides advanced转载 2011-12-09 15:05:56 · 854 阅读 · 0 评论 -
如何消除音频输出端的喀嗒声
喀嗒声指恼人的音频瞬态噪声,在耳机放大器打开或关闭时由耳机产生。通过去掉传统耳机放大器输出端的隔直电容,美信公司的DirectDrive专利技术可去除喀嗒声,同时提供更好的低频响应。本文先阐述DirectDrive原理,如何工作以及带来的优点。然后介绍一个在手机等便携设备上已验证的去除耳机喀嗒声的方法。便携音频产品的差异化一直是个热门话题。什么特点能让产品A相比竞争产品B更出色?通常的转载 2012-01-17 10:10:22 · 1950 阅读 · 0 评论 -
声音“三要素”---响度(loudness),音高(pitch),音色(timbre)
由于人耳听觉系统非常复杂,迄今为止人类对它的生理结构和听觉特性还不能从生理解剖角度完全解释清楚。所以,对人耳听觉特性的研究目前仅限于在心理声学和语言声学。 人耳对不同强度、不同频率声音的听觉范围称为声域。在人耳的声域范围内,声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽效应、高频定位等特性。其中响度、音高、音色可以在主观上用来描述具有振幅、频率和相位三个物理量的任何复杂的声音,故又称为声转载 2012-01-29 10:40:07 · 37259 阅读 · 2 评论 -
解密回声消除技术--转
一、前言因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里转载 2011-01-01 11:00:00 · 2860 阅读 · 0 评论 -
VoIP声学回声消除算法研究
0 引 言 近年来,VoIP(Voice over IP)技术及其业务的迅速发展,对传统的电信业务造成了巨大的冲击,与传统电话相比,IP电话以其网络带宽利用率高,通话成本低,可灵活地提供丰富的增值功能而备受市场青睐。然而,由于VoIP的语音在与其他数据一起在网络中传输时要经过压缩、编码、打包等一系列处理,造成回声路径的延迟较大,延迟抖动也较大,严重影响了话音质量,阻碍了VoIP市场的拓展。因转载 2012-01-30 10:25:22 · 7588 阅读 · 0 评论 -
揭开Σ-ΔADC的神秘面纱
越来越多的应用,例如过程控制、称重等,都需要高分辨率、高集成度和低价格的ADC。新型Σ-Δ转换技术恰好可以满足这些要求。然而,很多设计者对于这种转换技术并不十分了解,因而更愿意选用传统的逐次比较ADC。Σ-Δ转换器中的模拟部分非常简单(类似于一个1bit ADC),而数字部分要复杂得多,按照功能可划分为数字滤波和抽取单元。由于更接近于一个数字器件,Σ-ΔADC的制造成本非常低廉。一、Σ-ΔAD转载 2012-01-30 10:18:44 · 5094 阅读 · 0 评论 -
语音合成方法的主要分类
语音合成的研究已有多年的历史,现在研究出的语音合成方法的分类,从技术方式讲,可分为波形合成法、参数合成法、和规则合成方法;从合成策略上讲可分为频谱逼近和波形逼近。 1、 波形合成法 波形合成法一般有两种形式,一种是波形编码合成,它类似于语音编码中的波形编解码方法,该方法直接把要合成的语音发音波形进行存储,或者进行波形编码压缩后存储,合成重放时再解码组合输出。另一种是波形编辑转载 2012-02-09 23:43:15 · 14371 阅读 · 0 评论 -
The full list of WAV file format codes
/* WAVE form wFormatTag IDs */#define WAVE_FORMAT_UNKNOWN 0x0000 /* Microsoft Corporation */#define WAVE_FORMAT_ADPCM 0x0002 /* Microsoft Corporation */转载 2016-02-14 13:29:36 · 834 阅读 · 0 评论 -
Alsa驱动移植
作者:程姚根,华清远见嵌入式学院讲师。一. 下载alsa所需要的库和测试alsa的测试工具,此次使使用的是alsa-lib-1.0.24.1.tar.bz2、alsa-utils-1.0.24.2.tar.bz2。二. 默认情况下内核已经支持alsa驱动,保险情况下先去确认一下,如下图:Device Drivers ---> Sound card suppor转载 2011-12-10 17:38:08 · 2136 阅读 · 0 评论 -
ALSA Soc音频驱动分析
1. Soc audio driver module 注册一个name为”soc-audio”的驱动程序soc_driver platform_driver_register(soc_driver) static struct platform_driver soc_driver = { .driver转载 2011-12-09 14:05:22 · 835 阅读 · 0 评论 -
关于音质评价
<br />客观评价<br />客观评测可以不像主观评测那样刻意寻找对比的对象,因为客观评测是靠数据说话,数据不会因为个人的听感不同而不同,但请注意:并非客观评 测得出 来的数据越优越,随身听的听感也就越优越——音质不仅仅是数据那么简单,客观评测的数据只是参数,只能拿来当作参考之一。假如需要购买随身听,最 重要的还 是亲自试听对比。 <br />客观评测由于其客观性,相对主观评测要死板得多,而且客观评测都是计算机包办,专业术语较多,在这里我就不多说 了。比较牛B的客观评测软件是RMAA(RightMark转载 2010-12-12 15:00:00 · 2567 阅读 · 0 评论 -
声压级--SPL
声压级以符号SPL表示,其定义为将待测声压有效值p(e)与参考声压p(ref)的比值取常用对数,再乘以20,即: SPL=20LOG(10)[p(e)/p(ref)] 其单位是分贝。 在空气中参考声压p(ref)一般取为2*10E-5帕,这个数值是正常人耳对1千赫声音刚刚能觉察其存在的声压值,也就是1千赫声音的可听阈声压。一般讲,低于这一声压值,人耳就再也不能觉察出这个声音的存在了。显然该可听阈声压的声压级即为零分贝。原创 2010-12-14 23:15:00 · 9338 阅读 · 0 评论 -
关于响度、响度级、声强、声强级、声压、声压级、分贝、方、电平、增益、音高、音分
在录音声学里,响度、响度级、声强、声强级、声压、声压级、分贝、方、电平、增益、音高、音分总是令人头疼的若干概念,这里简单的说一下他们的意义和区别,让我们把它们的顺序整理一下。分贝:分贝是声级测量中最常用的单位,被简写为dB。其中小写的d代表英文decibel即分贝,而大写的B代表Bel即贝尔,采用小写d和大写B主要说明分贝和贝尔之间的关系为1:10即1分贝等于十分之一贝尔。 需要说明的是,0dB并非代表完全静寂状态,而是代表人耳的听阈点,也就是听力正常的人所能觉察到的最低声压级。——功率增加一倍代表增转载 2010-12-14 23:44:00 · 18258 阅读 · 1 评论 -
G.7xx系列典型语音压缩标准介绍
国际电信联盟G系列典型语音压缩标准的参数比较:算法类型码率(kbit/s)算法延时(ms)G.711A-Law / μ -Law640G.722SB-ADPCM64/56/480G.723.1MP-MLQ/ACELP6.3/5.337.5G.726ADPCM16/24/32/400G.727Embedded ADPCM16/24/32/400G.728LD-CELP16 在国际标准中,统一使用 MOS(Mean Opinion Score)方法评价语音压缩后的质量。在MOS方法中,电话语音质量的标准定为4转载 2010-12-30 20:05:00 · 2338 阅读 · 0 评论 -
Jitter知识--时基/时基抖动
什么是JitterJitter知识原著:Charles Altmann编译:王轩骞(hotpoint)Chapter 1:什么是jitterEpisode 1:什么是jitter所谓jitter就是一种抖动。具体如何解释呢?让我们来看一个例子。假如你有个女友,你希望她每天晚上下班之后7点来找你,而有的时候她6:30到,有的时候是7:23,有的时候也许是下一天。这种时间上的不稳定就是jitter。如果你多观察这种时间上的不规律性,你会对jitter有更深一些的理解。在你观察的这段期间内,女友最早和最晚到来的时转载 2011-01-01 00:41:00 · 12913 阅读 · 0 评论 -
Audio FomatTag GUID
0x0000WAVE_FORMAT_UNKNOWNMicrosoft Corporation未知或未指定的格式0x0001WAVE_FORMAT_PCMMicrosoft Corporation整数格式的 PCM 音频0x0002WAVE_FORMAT_ADPCMMicrosof转载 2011-07-18 14:17:09 · 975 阅读 · 0 评论 -
MP3解码算法分析——MP3帧头(Frame Header)数据结构描述
MP3解码算法分析(2)——MP3帧头(FrameHeader)数据结构描述 1. 帧头(Frame Header)数据结构描述 A B C D E F G H I J K L M AudioData 12 1 2 1 4 2转载 2011-11-16 14:09:09 · 2495 阅读 · 0 评论 -
Android系统级深入开发之OpenMax系统结构和移植内容
Android系统级深入开发之OpenMax系统结构和移植内容2011-03-01 16:36 | 1169次阅读 | 来源:电子工业出版社 【已有0条评论】发表评论关键词:图书,调试,移植,移动开发,Android | 作者:韩超 梁泉 | 收藏这篇资讯<!--pre {white-space:pre-wrap; font-size:14p转载 2011-12-05 15:18:21 · 1674 阅读 · 0 评论 -
graphic and parameter EQ
Like 什么是均衡器 均衡器简介均衡器是一种可以分别调节各种频率成分电信号放大量的电子设备,通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源及其它特殊作用,一般调音台上的均衡器仅能对高频、中频、低频三段频率电信号分别进行调节。均衡器分为三类:图示均衡器,参量均衡器和房间均衡器。1.图示均衡器:亦称图表均衡器,通过面板上推拉键的分布,可直观地反转载 2011-12-08 11:24:15 · 1067 阅读 · 0 评论 -
ffmpeg编译,ffplay播放RTSP流,音频格式为AAC-ELD
rtspServer已经ready, 音频格式为AAC-ELD,encoder 为libfdk-aac。 发现VLC和ffplay不能正常解码AAC-ELD。FFmpeg可以支持3钟AAC-LC编码器(aac、libfaac、libfdk_aac)和1种HE-AAC编码器(libfdk_aac)。因为libfaac和libfdk_aac的许可协议和GPL协议不兼容,因此GPL协议不允许发布包含这种...原创 2018-05-04 17:07:19 · 2914 阅读 · 0 评论