用Python写了一个汉字词频统计程序,针对已经分好词的文本。
#python 3.4.3
#功能:统计文本中的词频。
#缺陷:标点符号的频数也会计算在内。
with open('test.txt', mode='r', encoding='utf-8') as inFile:
dict={} # 创建一个空字典
word='' # 空字符串以便于连接字符
for char in inFile.read():
用Python写了一个汉字词频统计程序,针对已经分好词的文本。
#python 3.4.3
#功能:统计文本中的词频。
#缺陷:标点符号的频数也会计算在内。
with open('test.txt', mode='r', encoding='utf-8') as inFile:
dict={} # 创建一个空字典
word='' # 空字符串以便于连接字符
for char in inFile.read():