在学习python自然语言处理时,使用如下语句统计文档语料中的词汇频率。
例子如下:
from __future__ import division
len(text1)/len(set(text1)) //set()获得文档里的词汇数(唯一性的词汇)
但是在python3.0以上会出现以下错误:
经过查找也未发现。但是直接进行精确除法如下:
毫无问题。
要使用截断除法格式如下:
>>> 3//4
0
>>>
在学习python自然语言处理时,使用如下语句统计文档语料中的词汇频率。
例子如下:
from __future__ import division
len(text1)/len(set(text1)) //set()获得文档里的词汇数(唯一性的词汇)
但是在python3.0以上会出现以下错误:
经过查找也未发现。但是直接进行精确除法如下:
毫无问题。
要使用截断除法格式如下:
>>> 3//4
0
>>>