#!/usr/bin/env python
# encoding: utf-8
"""
@author: wg
@software: PyCharm
@file: word_frequency_statistics.py
@time: 2017/3/16 0016 10:46
"""
import os
import nltk
'''
利用NLTK 统计多个文本中的词频
'''
dirs = os.listdir('../../data/大秦帝国/') # 获取根目录
dictionary = {} # 空词典,用于保存最终的词频
stopwords = ['、','(',')',',','。',
Python 3.6 利用NLTK 统计多个文本中的词频
最新推荐文章于 2024-08-15 09:10:20 发布