自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (6)
  • 收藏
  • 关注

原创 时间戳杂谈

参考时钟与时间戳处理1、参考时钟       用于作为系统的唯一参考,一般以系统启动时间开始计时,具体数值影响不大,主要是做一个比较和参考作用。参考时钟设计时主要保证稳定性,尽量不产生时钟偏移。2、时间戳时间戳有两种,1)同步时间戳        之所以称为同步,其作用是同步多个流之间的操作,如果只有一个流,显然这个时间戳是没有意义的。一般通常用于音频和视频的同步播放。

2014-02-20 16:28:55 3162

原创 WebRTC源码分析四:视频模块结构

本文在上篇的基础上介绍WebRTC视频部分的模块结构,以进一步了解其实现框架。一、对外接口       对外接口有ViEBase,ViECapture,ViECodec,ViEEncryption,ViEFile,ViEImageProcess,ViENetwork,ViERender和ViERTP_RTCP。主要接口有:1)ViEBase:负责创建和管理视频会话链路;2)ViEC

2014-02-19 16:12:06 10672 1

原创 WebRTC源码分析三:视频处理流程

文本介绍视频的处理流程。图1中显示了两路视频会话视频信号流过程。以一路视频会话为例,主要分为以下几个线程:1)视频源产生线程:Camera生产视频画面,封装成视频帧,以一定帧率投递到下一个模块。;2)采集线程:由Capturer负责采集视频帧,并对视频帧进行一定处理,如调整画面亮度。并送入各个发送链路的编码模块编码并发送出去;3)接收线程:Rtp/Rtcp负责接收RTP/R

2014-02-19 11:32:17 12843 5

原创 WebRTC源码分析二:音频模块结构

本文介绍WebRTC音频模块组成和结构,详细介绍音频引擎的配置和启动,相信看完本文后,很多人可以利用webRTC完成一个音频通话程序开发。一、对外接口      音频部分的对外主要接口如下,各个接口之间的关系如图1所示。1)VoiceEngine:负责引擎的所有接口查询,存储共享数据信息ShareData。2)VoEBase:负责音频处理的基本操作。3)VoEAudioProc

2014-02-17 17:44:30 18651 4

原创 WinHTK开发与使用三:连续语音识别

WinHTK开发与使用三:连续语音识别 本文接上文,介绍连续语音识别系统设计过程,演示视频见下载资源中。二、连续语音识别系统设计        上面讨论了一个简单的十个孤立数字识别系统的设计过程,可以看出比较简单,效果也非常好。下面将设计一连续语音识别系统,相比较于孤立词识别而言,它有很多不同的地方,且过程也比较繁琐复杂,识别效果并不是非常好(当然这是有很多原因的)。为了便于实现

2014-02-16 11:31:45 7582 1

原创 WinHTK开发与使用二:孤立词识别

WinHTK开发与使用二:孤立词识别        本文在WinHTK软件设计的基础之上,介绍设计语音识别系统过程。具体包括孤立词语音和连续语音识别系统设计,这里先介绍孤立词的识别。语音识别系统设计过程主要包括四个步骤[32]:数据准备,模型训练,识别测试,效果分析,如图1所示。 图1 基于WinHTK语音识别系统设计过程一、孤立词识别本设计的内容是介绍一个识别0到9共

2014-02-15 22:05:20 3604 3

原创 WinHTK开发与使用一:软件设计

WinHTK开发与使用一:软件设计        接触语音识别的同行都会了解HTK,HTK工具包的功能很强大;但是对于习惯界面操作的很多人而言,它有一些先天不足。当然对于一开始就习惯类Unix等命令行界面开发者而言,这些都不是问题,所以本系列文章只针对熟悉可见即可及操作的对于语音识别感兴趣的初学者。因导致HTK不方便使用的原因主要以下几点:(1) 不方便安装,随便上网上一搜,涉及HTK

2014-02-15 17:59:49 3551 14

原创 WebRTC源码分析一:音频处理流程

本文概要介绍webRTC的音频处理流程,见下图:webRTC将音频会话抽象为一个通道Channel,譬如A与B进行音频通话,则A需要建立一个Channel与B进行音频数据传输。上图中有三个Channel,每个Channel包含编解码和RTP/RTCP发送功能。以一个Channel而言,应用程序中将包含三个活动线程,录音线程,音频接收线程和播放线程。1)录音线程:负责麦克风音

2014-02-14 15:18:25 13650 6

原创 命令行解析代码

开发设计过程中,往往要对命令行进行解析,下面实现了命令行解析功能,具体见代码(QuickHash在之前文章中):命令选项类,封装-p等命令选项#ifndef COMMAND_OPTION_H#define COMMAND_OPTION_H#include /**@file CommandOption.h * * @author xiaoxing.zhou * @date 201

2014-02-11 10:15:59 5225

OverSim仿真软件

Oversim模块根据他的名字就看出他主要是用于Overlay类型的应用层网络仿真所设计的。但是在实际的开发中,他却主要用在目前主要的那些P2P应用协议的仿真上了。 Oversim的底层是建立在一套简化的UDP协议之上(依靠了INET里面的实现),在其上,他定义了一套层次框架,由下至上为 OverlayApplicatoin Tier1 Applicatoin Tier2 Applicatoin Tier3 . 根据其设计的说明, Overlay层用于包括通用的底层Overlay协议的实现。而上层具体的应用,可以一层一层的叠加上去,作为Tier1Tier2 Tier3。拿P2P的仿真来举例,通用的Pastry协议的实现就是放在Overlay这层的,而可以利用Pastry的各种应用,比如p2p存储, 聊天,媒体播放功能可以作为Tier1层堆叠上去。 各个层次的对上层接口都由Oversim定义,也可以自己扩充(我就扩充了一套专门用于媒体数据传输的接口)。可以说Oversim提供了一个很不错的P2P设计的程序框架的参考。 

2014-02-25

WinHTK3演示

博客中的连续语音识别演示,详细见博客描述

2014-02-16

状态机设计

介绍软件状态机的设计与实现,包含普通状态机和层次状态机的介绍

2012-04-27

小波变换学习资料

学小波变换的参考资料,里面包含介绍小波变换的基础知识,比较易懂

2012-04-26

优秀精美简历模板集合

优秀精美简历模板集合,非常完整,快毕业的可以下来看看

2011-06-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除