自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

程序的魅力

You should blog even if you have no readers

  • 博客(5)
  • 资源 (4)
  • 收藏
  • 关注

原创 win64下python2.7安装numpy

通过easy-install可以方便的安装Python模块,但是需要通过执行ez_setup.py脚本安装setuptools,下载ez_setup.py脚本。通过Python ez_setup.py执行脚本后,在安装目录python27/Scripts下有easy_install文件。例如安装pip工具,可以通过easy_install pip来安装。但是通过easy_install安装nu

2016-03-18 16:51:14 830

原创 NLTK查看

nltk.sent_tokenize(text) #对文本按照句子进行分割nltk.word_tokenize(sent) #对句子进行分词,当输入的是包含多个句子的文档时,返回列表,每个列表包含对应句子的分词结果。for word in word_tokenize(document): texts_tokenized_tmp += jieba.analys

2016-03-18 16:22:43 2473

原创 自然语言处理模型——LSI

LSI,英文:Latent Semantic Indexing的缩写,中文意译是潜在语义索引,指的是通过海量文献找出词汇之间的关系。当两个词或一组词大量出现在一个文档中时,这些词之间就可以被认为是语义相关的。“词袋”模型假设一个段落的词汇之间出现频率是无关联的。因此通过给文档建立文档词汇向量表维度很大,并且有数据稀疏问题,通过LSI建模,通过大量的统计,得出相关词汇构成一个潜在的主题,本质是给

2016-03-18 10:48:20 7025

原创 对象的困惑

类、继承、多态等概念带来的困扰,比带来的便捷大的多!大多数程序的目的是为处理数据,以函数为主线,接收数据,处理数据,然后返回处理后的值非常符合人的正常思维。在引入类、对象概念后,有了“方法”,它被包裹在类里面,处理内部数据,同时接收外部的调用,在逻辑上套了框框,思维开始难以清晰。怎么办呢?还是得适应。不再明显区分域和方法,而更多把它们都当做成员,只不过成员有别,那个叫做“方法”的成员,可以

2016-03-08 22:14:48 540 2

原创 Python变量作用域

变量的作用域整这么复杂,而且都是隐含的表达。变量的作用域是程序员几乎每行代码都会涉及到的概念,定义的这么隐晦。相比起来Java人性了许多,严肃了许多。

2016-03-08 19:15:19 393

HTK中的数据结构的关系

用Visio画的数据结构的示意图,希望对理解HTK源码有帮助。涉及HMMSet、HMMDef、StateElem、StateInfo、StreamElem、MixtureElem、MixPDF等,还有UttInfo、Transcription、Observation和它们之间的组合/包含关系。

2020-10-30

数据结构与算法C++模板实现在vs环境下

C++模板类的形式实现了基本的数据结构和算法:交换算法、快排序、选择排序、归并排序、二叉树、AVL树、2-3树、双向链表、队列等。红黑树还没完成。

2019-08-30

bash-vim-editing-cheat-sheet

对于习惯vim编辑的linux用户,在~/.bashrc文件中添加set -o vi,设置bash vim命令模式,可以加快方便输入

2014-03-27

语音识别算法研究

介绍了语音识别的过程,设计的算法,对希望概念性地了解语音识别的人有点帮助。

2012-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除