自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 几个常见的语音交互平台的简介和比较

由于自己上次可能没写好,这次突然见到这个,就转载到这里。转载:http://ibillxia.github.io/blog/2012/11/24/several-plantforms-on-audio-and-speech-signal-processing/几个常见的语音交互平台的简介和比较1.概述最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,

2015-04-13 09:00:43 1175

转载 语音识别工具箱综述和产品介绍

今天是周末,想来想去,还是写一篇这样的博文吧。算是对语音识别这一段时间的总结,为后来的人融入铺好前面的路。这个只是工具箱的综述,不是语音识别的综述。希望您有所收获。    目前,语音识别领域公开的开源的代码或者说工具箱有:sphinx,htk,julius,kaldi。也许也有其他的吧。下面我尽量一一介绍:1.sphinx:这个是李开复的博士论文。后面不断的壮大,有了后来的版本。这

2015-04-13 08:59:09 694

转载 善假于物,利用工具2天开发一款完整新闻类iOS app

题外话:此篇文章以一个iOS新手的角度解释一款新闻类iOS APP诞生的过程,详细介绍在这过程中碰到的问题和我的解决思路。欢迎大家指正。菜单界面:主界面:详细页面:关于我们页面:初期的想法具体项目背景跳过,我们着重看如何实现一款新闻类APP。在开始项目计划前,我下载了大量的新闻类APP进行研究,不论是and

2015-02-02 11:49:25 729

原创 句法结构中的语义分析

句法结构中的语义分析 学习要点:掌握句法结构分析中运用语义关系、语义指向、语义特征三种语义分析方法,并且能够运用这些分析法解释一些常见的语言现象。     句法结构是句法形式和语义内容的统一体。对句法结构不仅要做形式分析,如句法层次分析、句法关系分析、以及句型分析等,还要做种种语义分析。句法结构中的语义分析主要指语义关系、语义指向、语义特征三种分析法。一、语义关系    (

2015-01-07 22:59:50 13714

转载 CRF知识汇总

转载来自:http://blog.csdn.net/forever1dreamsxx/article/details/8213309原文地址:http://blog.csdn.net/某某某的专栏todaylxp/article/details/4204038  分词过程CRF分词原理1. CRF把分词过程看做字的词位分类问题,通常定义字的词位信息如下:词首,常

2015-01-03 11:35:30 2636

转载 Chinese corpus Training 參數的使用

转载来自:http://puremonkey2010.blogspot.tw/2012/08/stanford-parser-chinese-corpus-training.html前言 :stanford parser 是一個可進行短語結構和依存結構分析的parser,網絡上的資料很多,而且在stanford n​​lp 的網站上也有很多說明,代碼中的 readme 文件數的

2015-01-01 19:27:50 482

转载 从Nutch的输出日志分析其流程

一、简介1. Nutch是一个基于Hadoop和Lucene的一个网络爬行器,用于收集网页信息。2. 特点:基于Plugin机制以提高可扩展性;多协议和多线程分布式抓取;基于插件的内容分析机制;强大的抓取预处理控制;可扩展的数据处理模型(mapReduce);全文索引器和搜索引擎(Lucene or Solor),支持分布式查询;强大的API和集成配置。 二、一些必

2014-07-10 14:45:21 416

转载 社会化海量数据采集爬虫框架搭建

随着BIG DATA大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间内采集。这篇文章结合我们自身项目经验谈一下。我们来看一下作为人是怎么获取网页数据的呢?1、打开浏览器,输入网址url访问页面内容。2、复制页面内容的标题、作者、内容。3、存储到

2014-06-03 19:54:55 1305

转载 维基百科简体中文语料的获取

最近做实验需要较大规模的中文语料,很自然的就想到使用维基百科的中文数据。  使用维基百科做训练语料有很多好处:维基百科资源获取非常方便,有 Wiki Dump 可以直接下载,所有的最新备份都在里面。最近的一次备份是3月底,也就是5天前。相比之下,其他很多语料都需要用爬虫抓取,或者付费获得。维基百科的文档解析有非常多的成熟工具,直接使用开源工具即可完成正文的提取。维基百科的质量较高,而且

2014-06-01 17:30:59 3244

转载 Deep Learning in NLP(一)

这篇博客是我看了半年的论文后,自己对 Deep Learning 在 NLP 领域中应用的理解和总结,在此分享。其中必然有局限性,欢迎各种交流,随便拍。  Deep Learning 算法已经在图像和音频领域取得了惊人的成果,但是在 NLP 领域中尚未见到如此激动人心的结果。关于这个原因,引一条我比较赞同的微博。@王威廉:Steve Renals算了一下icassp录取文章题目中包含d

2014-06-01 17:18:55 865

转载 Google开源基于Deep Learning的word2vec工具

谷歌已经使用Deep Learning技术开发了许多新方法来解析语言,目前,谷歌开源了一款基于Deep Learning的学习工具——word2vec,这是首款面向大众的Deep Learning学习工具。word2vec(word to vector)顾名思义,这是一个将单词转换成向量形式的工具。通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本

2014-05-31 19:04:52 939

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除