u010920224-CSDN博客

转载几个常见的语音交互平台的简介和比较

由于自己上次可能没写好，这次突然见到这个，就转载到这里。转载：http://ibillxia.github.io/blog/2012/11/24/several-plantforms-on-audio-and-speech-signal-processing/几个常见的语音交互平台的简介和比较1.概述最近做了两个与语音识别相关的项目，两个项目的主要任务虽然都是语音识别，

2015-04-13 09:00:43 1175

转载语音识别工具箱综述和产品介绍

今天是周末，想来想去，还是写一篇这样的博文吧。算是对语音识别这一段时间的总结，为后来的人融入铺好前面的路。这个只是工具箱的综述，不是语音识别的综述。希望您有所收获。目前，语音识别领域公开的开源的代码或者说工具箱有：sphinx，htk，julius，kaldi。也许也有其他的吧。下面我尽量一一介绍：1.sphinx：这个是李开复的博士论文。后面不断的壮大，有了后来的版本。这

2015-04-13 08:59:09 694

转载善假于物，利用工具2天开发一款完整新闻类iOS app

题外话：此篇文章以一个iOS新手的角度解释一款新闻类iOS APP诞生的过程，详细介绍在这过程中碰到的问题和我的解决思路。欢迎大家指正。菜单界面：主界面：详细页面：关于我们页面：初期的想法具体项目背景跳过，我们着重看如何实现一款新闻类APP。在开始项目计划前，我下载了大量的新闻类APP进行研究，不论是and

2015-02-02 11:49:25 729

原创句法结构中的语义分析

句法结构中的语义分析学习要点：掌握句法结构分析中运用语义关系、语义指向、语义特征三种语义分析方法，并且能够运用这些分析法解释一些常见的语言现象。句法结构是句法形式和语义内容的统一体。对句法结构不仅要做形式分析，如句法层次分析、句法关系分析、以及句型分析等，还要做种种语义分析。句法结构中的语义分析主要指语义关系、语义指向、语义特征三种分析法。一、语义关系（

2015-01-07 22:59:50 13714

转载 CRF知识汇总

转载来自：http://blog.csdn.net/forever1dreamsxx/article/details/8213309原文地址：http://blog.csdn.net/某某某的专栏todaylxp/article/details/4204038 分词过程CRF分词原理1. CRF把分词过程看做字的词位分类问题，通常定义字的词位信息如下：词首，常

2015-01-03 11:35:30 2636

转载 Chinese corpus Training 參數的使用

转载来自:http://puremonkey2010.blogspot.tw/2012/08/stanford-parser-chinese-corpus-training.html前言 :stanford parser 是一個可進行短語結構和依存結構分析的parser，網絡上的資料很多，而且在stanford nlp 的網站上也有很多說明，代碼中的 readme 文件數的

2015-01-01 19:27:50 482

转载从Nutch的输出日志分析其流程

一、简介1. Nutch是一个基于Hadoop和Lucene的一个网络爬行器，用于收集网页信息。2. 特点：基于Plugin机制以提高可扩展性；多协议和多线程分布式抓取；基于插件的内容分析机制；强大的抓取预处理控制；可扩展的数据处理模型(mapReduce)；全文索引器和搜索引擎(Lucene or Solor)，支持分布式查询；强大的API和集成配置。二、一些必

2014-07-10 14:45:21 416

转载社会化海量数据采集爬虫框架搭建

随着BIG DATA大数据概念逐渐升温，如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间内采集。这篇文章结合我们自身项目经验谈一下。我们来看一下作为人是怎么获取网页数据的呢？1、打开浏览器，输入网址url访问页面内容。2、复制页面内容的标题、作者、内容。3、存储到

2014-06-03 19:54:55 1305

转载维基百科简体中文语料的获取

最近做实验需要较大规模的中文语料，很自然的就想到使用维基百科的中文数据。　　使用维基百科做训练语料有很多好处：维基百科资源获取非常方便，有 Wiki Dump 可以直接下载，所有的最新备份都在里面。最近的一次备份是3月底，也就是5天前。相比之下，其他很多语料都需要用爬虫抓取，或者付费获得。维基百科的文档解析有非常多的成熟工具，直接使用开源工具即可完成正文的提取。维基百科的质量较高，而且

2014-06-01 17:30:59 3244

转载 Deep Learning in NLP（一）

这篇博客是我看了半年的论文后，自己对 Deep Learning 在 NLP 领域中应用的理解和总结，在此分享。其中必然有局限性，欢迎各种交流，随便拍。　　Deep Learning 算法已经在图像和音频领域取得了惊人的成果，但是在 NLP 领域中尚未见到如此激动人心的结果。关于这个原因，引一条我比较赞同的微博。@王威廉：Steve Renals算了一下icassp录取文章题目中包含d

2014-06-01 17:18:55 865

转载 Google开源基于Deep Learning的word2vec工具

谷歌已经使用Deep Learning技术开发了许多新方法来解析语言，目前，谷歌开源了一款基于Deep Learning的学习工具——word2vec，这是首款面向大众的Deep Learning学习工具。word2vec（word to vector）顾名思义，这是一个将单词转换成向量形式的工具。通过转换，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本

2014-05-31 19:04:52 939

u010920224的专栏