自然语言处理
麦才坚
这个作者很懒,什么都没留下…
展开
-
分词器
一.有关NLP分词器的介绍如下: github 地址:https://github.com/tsroten/pynlpir2)安装其依赖包:pip install pynlpir pynlpir update3)示例代码如下:import pynlpirpynlpir.open()#f=open("re.txt")s = '问: 我们是深圳...原创 2018-03-26 09:15:46 · 132 阅读 · 0 评论 -
ID3 算法
1)信息熵: 假如一个随机变量的取值为,每一种取到的概率分别是,那么 的熵定义为 意思是一个变量的变化情况可能越多,那么它携带的信息量就越大,信息熵值越大,该系统越不稳定,存在的不定因素就越多。 对于分类系统来说,类别是变量,它的取值是,而每一个类别出现的概率分别是 而这里的就是类别的总数,此时分类系统的熵就可以表示为 ...原创 2018-03-26 16:47:09 · 14395 阅读 · 4 评论