- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 win64下python2.7安装numpy
通过easy-install可以方便的安装Python模块,但是需要通过执行ez_setup.py脚本安装setuptools,下载ez_setup.py脚本。通过Python ez_setup.py执行脚本后,在安装目录python27/Scripts下有easy_install文件。例如安装pip工具,可以通过easy_install pip来安装。但是通过easy_install安装nu
2016-03-18 16:51:14 830
原创 NLTK查看
nltk.sent_tokenize(text) #对文本按照句子进行分割nltk.word_tokenize(sent) #对句子进行分词,当输入的是包含多个句子的文档时,返回列表,每个列表包含对应句子的分词结果。for word in word_tokenize(document): texts_tokenized_tmp += jieba.analys
2016-03-18 16:22:43 2473
原创 自然语言处理模型——LSI
LSI,英文:Latent Semantic Indexing的缩写,中文意译是潜在语义索引,指的是通过海量文献找出词汇之间的关系。当两个词或一组词大量出现在一个文档中时,这些词之间就可以被认为是语义相关的。“词袋”模型假设一个段落的词汇之间出现频率是无关联的。因此通过给文档建立文档词汇向量表维度很大,并且有数据稀疏问题,通过LSI建模,通过大量的统计,得出相关词汇构成一个潜在的主题,本质是给
2016-03-18 10:48:20 7025
原创 对象的困惑
类、继承、多态等概念带来的困扰,比带来的便捷大的多!大多数程序的目的是为处理数据,以函数为主线,接收数据,处理数据,然后返回处理后的值非常符合人的正常思维。在引入类、对象概念后,有了“方法”,它被包裹在类里面,处理内部数据,同时接收外部的调用,在逻辑上套了框框,思维开始难以清晰。怎么办呢?还是得适应。不再明显区分域和方法,而更多把它们都当做成员,只不过成员有别,那个叫做“方法”的成员,可以
2016-03-08 22:14:48 540 2
原创 Python变量作用域
变量的作用域整这么复杂,而且都是隐含的表达。变量的作用域是程序员几乎每行代码都会涉及到的概念,定义的这么隐晦。相比起来Java人性了许多,严肃了许多。
2016-03-08 19:15:19 393
HTK中的数据结构的关系
2020-10-30
数据结构与算法C++模板实现在vs环境下
2019-08-30
bash-vim-editing-cheat-sheet
2014-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人