- 博客(12)
- 收藏
- 关注
原创 线程中断理解
无法中断的线程package objective1.action2;public class InterruptHandler { public static void main(String[] args) { Runnable runnable = new InterruptRunner(); Thread thread = new Thread(runna
2017-05-07 17:39:09 806
原创 中文分词软件包的使用
中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。下面
2014-12-10 14:09:15 12760
原创 Stanford Word Segmenter使用
Stanford Word Segmenter是斯坦福大学NLP group研发的一套基于CRF的开源中文分词系统,采用CRF(Conditional Random Fields)算法。下面将下载Stangford Word Segmenter 软件包,在Eclipse上调试成功,并进一步分析源码。1,下载 Stanford Word Segmenter软件包;Do
2014-11-26 17:51:38 4507
原创 隐马尔可夫模型 (Hidden Markov Model,HMM)理解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语音识别,自然语言处理以及生物信息等领域体现了很大的价值。到目前为止,它一直被认为是实现快速精确的语音识别系统的系统,自然语言处理过程的最成功的方法。
2014-11-26 10:49:10 10943
原创 朴素贝叶斯模型(Naive Bayes Model,NB)理解
Bayes定理P(A,B)=P(A|B)P(B); P(A,B)=P(B|A)P(A); P(A|B)=P(B|A)P(A)/P(B); 贝叶斯定理变形
2014-11-24 14:18:37 9588
原创 numpy包的安装
1,下载python下载地址: https://www.python.org/downloads/windows/ 2,配置python环境变量在电脑的系统属性的系统变量path中添加python的安装路径,如在path中加入 ;F:\Python34;F:\Python34\Scripts; 3,使用pip 指令安装nump
2014-11-24 12:46:51 1554
原创 python 集合 set
python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。
2014-11-23 15:54:01 998
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人