Python是做数据处理很好的工具,这里小试牛刀,用Python完成文章的字数统计。
系统:Ubuntu16.04
Python版本:3.4
文本:《西游记》txt片段
结果:存放于result.csv 中
# 下面两句可以查看使用的字符编码,结果为:utf-8
import sys
print (sys.getdefaultencoding())
fw = open('data.txt.utf8','r')
# character列表:存储所有出现的汉字
# stat字典:汉字为key值,出现次数为value值
characters = []
stat = {}
for line in fw:
line = line.strip()
# 如果某一行去掉空格没有内容,则这一行不做处理
if len(line) == 0:
continue
for x in