- 博客(127)
- 资源 (3)
- 收藏
- 关注
原创 Kinect开发学习笔记之(八)彩色、深度、骨骼和用户抠图结合
Kinect开发学习笔记之(八)彩色、深度、骨骼和用户抠图结合zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7 x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0开发环境的搭建见上一文: http://blog.csdn.net/zou
2012-11-08 17:30:43
22053
14
原创 Kinect开发学习笔记之(七)骨骼数据的提取
Kinect开发学习笔记之(七)骨骼数据的提取zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0开发环境的搭建见上一文: http://blog.csdn.net/zouxy09/arti
2012-11-08 12:54:01
105451
42
原创 Kinect开发学习笔记之(六)带游戏者ID的深度数据的提取
Kinect开发学习笔记之(六)带游戏者ID的深度数据的提取zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0开发环境的搭建见上一文: http://blog.csdn.net/zouxy
2012-11-05 23:49:14
19282
9
原创 Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取
Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7 x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0开发环境的搭建见上一文: http://blog.csdn.net/zou
2012-11-04 21:12:20
32153
40
原创 Kinect开发学习笔记之(四)提取颜色数据并用OpenCV显示
Kinect开发学习笔记之(四)提取颜色数据并用OpenCV显示zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7 x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0开发环境的搭建见上一文: http://blog.csdn.net/zo
2012-11-04 18:02:02
42817
38
原创 Kinect开发学习笔记之(三)Kinect开发环境配置
Kinect开发学习笔记之(三)Kinect开发环境配置zouxy09@qq.comhttp://blog.csdn.net/zouxy09 我的Kinect开发平台是:Win7 x86 + VS2010 + Kinect for Windows SDK v1.6 + OpenCV2.3.0 一、基本要求Microsoft Visual Studio®
2012-11-04 16:28:19
61550
29
原创 Kinect开发学习笔记之(二)Kinect开发学习资源整理
Kinect开发学习笔记之(二)Kinect开发学习资源整理zouxy09@qq.comhttp://blog.csdn.net/zouxy09 刚刚接触Kinect,在网上狂搜资料,获得了很多有利于学习Kinect开发的资源,现整理如下: 首先当然是官方的API介绍了,编程少不了的。Kinect for Windows Programming Guide:
2012-11-04 13:55:49
49890
8
原创 Kinect开发学习笔记之(一)Kinect介绍和应用
Kinect开发学习笔记之(一)Kinect介绍和应用zouxy09@qq.comhttp://blog.csdn.net/zouxy09 一、Kinect简介 Kinectfor Xbox 360,简称 Kinect,是由微软开发,应用于Xbox 360 主机的周边设备。它让玩家不需要手持或踩踏控制器,而是使用语音指令或手势来操作 Xbox360 的系统界面。它也能
2012-11-04 13:13:46
174047
4
原创 压缩跟踪Compressive Tracking
压缩跟踪Compressive Trackingzouxy09@qq.comhttp://blog.csdn.net/zouxy09 好了,学习了解了稀疏感知的理论知识后,终于可以来学习《Real-Time Compressive Tracking》这个paper介绍的感知跟踪算法了。自己英文水平有限,理解难免出错,还望各位不吝指正。 下面是这个算法
2012-10-27 13:11:22
70434
65
原创 压缩感知(Compressive Sensing)学习之(二)
压缩感知(Compressive Sensing)学习之(二)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 上一回粗略的引入了压缩感知。 http://blog.csdn.net/zouxy09/article/details/8118313 下面就针对自己的了解,具体总结下压缩感知理论。由于自己也是
2012-10-27 13:01:17
123158
27
原创 机器学习知识点学习
机器学习知识点学习zouxy09@qq.comhttp://blog.csdn.net/zouxy09 在学习机器学习的有关知识时,搜索到JerryLead的cnblog中的Machine Learning专栏,里面对于机器学习的部分算法和知识点讲解地很经典和透彻。所以Mark在这,多多学习!http://www.cnblogs.com/jerrylead/tag
2012-10-23 12:20:09
17836
2
转载 和机器学习和计算机视觉相关的数学
和机器学习和计算机视觉相关的数学之一(以下转自一位MIT牛人的空间文章,写得很实际:)作者:Dahua感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个
2012-10-18 10:48:40
19372
3
转载 Learning中的代数结构的建立
Learning中的代数结构的建立转自:http://blog.sina.com.cn/s/blog_6833a4df0100nazk.htmlLearning是一个融会多种数学于一体的领域。说起与此有关的数学学科,我们可能会迅速联想到线性代数以及建立在向量空间基础上的统计模型——事实上,主流的论文中确实在很大程度上基于它们。R^n (n-维实向量空间) 是我们在paper中见到最多的
2012-10-18 10:45:36
5848
2
原创 用单张2D图像重构3D场景
用单张2D图像重构3D场景zouxy09@qq.comhttp://blog.csdn.net/zouxy09 之前看到Stanford大学的机器学习公开课程的lecture01中,Andrew Ng介绍他的两个学生用单幅图像去重构这个场景的三维模型。感觉非常厉害,所以就自己了解了一下。而这个研究也在相应的大学网站上面提供了详细的资料,包括相关论文、编写的代码和训练涉及到的
2012-10-17 23:25:22
44424
5
转载 数学之美番外篇:平凡而又神奇的贝叶斯方法
数学之美番外篇:平凡而又神奇的贝叶斯方法 转载自:http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/ 概率论只不过是把常识用数学公式表达了出来。——拉普拉斯 记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系
2012-09-21 17:11:31
14038
2
转载 理解矩阵
无意中看到孟岩老师的关于理解矩阵的博客,为之思维所惊叹!受益匪浅啊,故转载之: 理解矩阵一:转载自:http://blog.csdn.net/myan/article/details/647511前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被那位强势的
2012-09-21 16:08:58
14416
10
原创 PocketSphinx语音识别系统的编程
PocketSphinx语音识别系统的编程zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外的博文:语音识别的基础知识与CMUsphinx介绍:http://blog.csdn.net/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和使用:http:/
2012-09-14 10:59:11
30280
8
原创 PocketSphinx语音识别系统声学模型的训练与使用
PocketSphinx语音识别系统声学模型的训练与使用zouxy09@qq.com 声学模型主要用于计算语音特征和每个发音模板之间的似然度。目的是为每个声学单元建立一套模型参数(通过不断地学习和改进得到最优的,也就是概率最大的一组HMM模型参数)。需要训练的情况:1)需要创建一个新的语音或者方言的模型;2)为你的小词汇的应用创建一个特定的模型;3)你有足
2012-09-10 10:37:54
25967
18
原创 PocketSphinx语音识别系统语言模型的训练和声学模型的改进
PocketSphinx语音识别系统语言模型的训练和声学模型的改进zouxy09@qq.com 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外两篇博文:语音识别的基础知识与CMUsphinx介绍:http://blog.csdn.net/zouxy09/article/details/7941585PocketSphinx语音识别系统的编译、安装和
2012-09-06 09:27:01
34177
36
原创 PocketSphinx语音识别系统的编译、安装和使用
PocketSphinx语音识别系统的编译、安装和使用zouxy09@qq.com Sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。Sphinx从开发之初就得到了CMU、DARPA等多个部门的资助和支持,后来逐步发展为开源项目。目前CMU Sphinx小组开发的下列译码器: Sphinx-2采用半连续隐含马尔可夫模型(SC
2012-09-04 16:36:29
67130
37
原创 语音识别的基础知识与CMUsphinx介绍
语音识别的基础知识与CMUsphinx介绍zouxy09@qq.com 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。 基于语音识别芯片的嵌入式产品也越来越多,如Sensory公司的RSC系列语音识别芯片、Infineon公司的Unispeech和Unilite语音芯片等,这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上,目
2012-09-04 13:06:06
54778
28
翻译 语音的基本概念--译自CMU sphinx
语音的基本概念--译自CMU sphinxzouxy09@qq.com 译自:http://cmusphinx.sourceforge.net/wiki/tutorialconcepts 这是CMU sphinx语音识别系统wiki的第一部分,主要是介绍语音的一些基本概念的。我试着翻译了一下。英语水平受限,翻译难免出错,请各位不吝指点!呵呵 Basi
2012-09-04 10:53:23
27634
8
原创 交互系统的构建之(四)手掌与拳头检测加盟TLD
交互系统的构建之(四)手掌与拳头检测加盟TLDzouxy09@qq.com 人机交互系统的构建之(一)http://blog.csdn.net/zouxy09/article/details/7919618中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检测等等
2012-08-31 16:48:36
13088
18
原创 目标检测的图像特征提取之(三)Haar特征
目标检测的图像特征提取之(三)Haar特征zouxy09@qq.com1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩
2012-08-31 15:41:28
154647
23
原创 目标检测的图像特征提取之(二)LBP特征
目标检测的图像特征提取之(二)LBP特征zouxy09@qq.com LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理
2012-08-31 15:33:21
175283
45
原创 目标检测的图像特征提取之(一)HOG特征
目标检测的图像特征提取之(一)HOG特征zouxy09@qq.com1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的
2012-08-31 15:08:16
281753
67
原创 计算机视觉目标检测的框架与过程
计算机视觉目标检测的框架与过程zouxy09@qq.com 个人接触机器视觉的时间不长,对于机器学习在目标检测的大体的框架和过程有了一个初步的了解,不知道对不对,如有错误,请各位大牛不吝指点。 目标的检测大体框架:目标检测分为以下几个步骤:1、训练分类器所需训练样本的创建: 训练样本包括正样本和负样本;其中正例样本是指待检目标样本(例如人脸
2012-08-31 13:14:06
33044
18
转载 浅析人脸检测之Haar分类器方法:Haar特征、积分图、 AdaBoost 、级联
浅析人脸检测之Haar分类器方法一、Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来。 目前的人脸检测方法主要有两大类:基于知识和基于统计。Ø 基于知识的方法:主要利用先验知识将人脸看作器官特征的组合,根
2012-08-30 09:55:48
96968
51
原创 交互系统的构建之(三)TTS语音合成的加盟
交互系统的构建之(三)TTS语音合成的加盟zouxy09@qq.com 人机交互系统的构建之(一)http://blog.csdn.net/zouxy09/article/details/7919618中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检测等等。
2012-08-29 16:48:15
9578
6
原创 交互系统的构建之(二)Linux下鼠标和键盘的模拟控制
交互系统的构建之(二)Linux下鼠标和键盘的模拟控制zouxy09@qq.com 交互系统的构建之(一)http://blog.csdn.net/zouxy09/article/details/7919618 中提到我的整个交互系统包含以下部分: TLD系统、TTS语音合成、语音识别、手势和语音控制鼠标和键盘、运行前加入手掌的检测(这样就不用鼠标画目标box了)、拳头的检
2012-08-29 14:53:03
16571
2
原创 交互系统的构建之(一)重写Makefile编译TLD系统
交互系统的构建之(一)重写Makefile编译TLD系统zouxy09@qq.com 为了对TLD系统做一些功能的填充,例如添加语音合成来提示跟踪状态,或者加入语音识别来增加交互体验等,我就自己写了个Makefile来编译TLD系统。因为TLD的Makefile是通过cmake生成的,比较复杂,如果要加入语音合成等等API的库或者头文件的话,我都不知道在什么地方加,所以自己的整理
2012-08-29 12:34:10
6988
3
原创 TTS技术简单介绍和Ekho(余音)TTS的安装与编程
TTS技术简单介绍和Ekho(余音)TTS的安装与编程zouxy09@qq.com一、TTS技术简单介绍: TTS技术,TTS是Text To Speech的缩写,即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他语言语音)输出的技术,隶属于语音合成(SpeechSynthesis)。TTS的基本组成:(1)
2012-08-26 15:27:59
29554
9
原创 Yaffs2根文件系统制作
Yaffs2根文件系统制作 zouxy09@qq.com环境: 交叉编译环境:4.3.3 (天嵌科技提供,存放路径/home/xiaoyi/4.3.3)开发平台:TQ2440注:这里有一些东西没有提到,请结合天嵌提供的linux移植手册来进行移植 一、编译busybox(主要是获得linux下的工具包和函数库,如bin、sbin下的工具)获取busybox
2012-08-24 19:00:36
11108
原创 cmos图像传感器应用实例及其发展趋势分析
cmos图像传感器应用实例及其发展趋势分析zouxy09@qq.com 1、PC终端摄像头1.1 应用要求:网络视频聊天,基本的电脑视频采集应用(如人脸、手势识别等),帧率一般30fps,动态图像获取占主要; 1.2 现有的产品情况:Ø 现在市场上电脑摄像头的品牌已经很多了,基本上都是采用CMOS彩色图像传感器。Ø 静态像素从低端的30万像素到高端的千万像素
2012-08-22 12:38:13
13387
1
原创 SAMSUNG的CMOS 图像传感器技术发展路线
SAMSUNG的CMOS 图像传感器技术发展路线 zouxy09@qq.com1、全新BSI技术三星高端背照CMOS发布1.1时间: 2010年09月08日 1.2新技术:三星方面将此技术定义为“背面照度像素技术”,英文简写为BSI。其主要技术特点为感光元件背面搜集光线,而会置于顶部的光敏二极管来进行记录。这样的设计使得其在暗光条件下感光敏感度提升了30%左右。
2012-08-22 12:24:04
9280
原创 SONY的CMOS 图像传感器技术发展路线
SONY的CMOS 图像传感器技术发展路线zouxy09@qq.com 图像质量的关键:高灵敏度和低噪声,所以SONY的技术改进也一直围绕在这两个方面。 技术的发展路线:高灵敏度、高速、高信噪比、低噪声、低照度、高动态范围、更强大的功能、更紧凑的尺寸。(1)单像素尺寸的工艺发展:从08年最小的1.75um,到09年最小的1.4um,再到11年最小的1.12u
2012-08-22 12:18:53
23691
2
原创 OmniVision的CMOS 图像传感器技术发展路线
OmniVision的CMOS 图像传感器技术发展路线: zouxy09@qq.com1、从OmniPixel1,到OmniPixel2,再到OmniPixel3技术推出时间像素尺寸(um)CMOS工艺(nm)结构OmniPixel-12004.8 FS
2012-08-22 11:27:31
12952
原创 ubuntu 12.04安装与配置
zouxy09@qq.comUbuntu是一个以桌面应用为主的Linux操作系统。Ubuntu每六个月发布一个新版本(一般是4和10月份,命名为YY.MM),每一个普通版本都将被支持 18个月,长期支持版(Long Term Support, LTS)的桌面版本支持 3年,服务器版本则是 5 年。因为她安装软件很方便(对于有网络而言),所以开发运用很方便。1、安装ubuntu
2012-08-21 21:00:30
26335
转载 openal全教程
/***************************************************************************openal全教程分类: OpenSceneGraph 2008-12-01 16:22 3015人阅读 评论(1) 收藏 举报 openal教程(一)简介L一直在不断 欢迎来到OPENAL的世界!OPENA的创新,几乎没有
2012-08-21 20:55:47
19846
5
原创 OpenAL跨平台音效API的安装与移植
OpenAL跨平台音效API的安装与移植zouxy09@qq.com OpenAL(Open Audio Library)是自由软件界的跨平台音效API。它设计给多通道三维位置音效的特效表现。其 API 风格模仿自 OpenGL。 OpenAL 最初是由 Loki Software 所开发。是为了将 Windows 商业游戏移植到 Linux 上。Loki 倒
2012-08-21 20:51:36
17743
3
手写识别数据库
2013-11-26
基于Qt的P2P局域网聊天及文件传送软件设计
2013-06-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人