一、文本字符统计
fr = open('兰亭集序.txt','rt',encoding='utf-8')
fw = open('兰亭集序-字符统计.txt','wt',encoding='utf-8')
txt_str = fr.read().strip().strip('\n')#不统计空格和回车'\n'
#遍历文本字符串,把字符、数量写入字典键值对
#把字符、数量分别存入列表
##key_list = []
##value_list = []
txt_dict = {}
parse_ls = []
for item in txt_str:
if item not in txt_dict.keys():
## key_list.append(item)#列表为可变数据类型
## value_list.append(txt_str.count(item))
txt_dict[item] = txt_str.count(item)
else:
continue
else:
print('统计完成!')
#是否有把2个列表的元素赋给字典{key:value}={字符:数量}的方法?
#txt_dict[key_list] = value_list
#统计结果写入csv
for key in txt_dict:
parse_ls.append("{}:{}".format(key,txt_dict[key]))
fw.write(','.join(parse_ls))
print('写入完成!')
fr.close()
fw.close
二、文本词频排序