Python文本解析之字符统计与词频排序

最新推荐文章于 2024-08-28 18:50:35 发布

toto+

最新推荐文章于 2024-08-28 18:50:35 发布

阅读量3.6k

点赞数 2

文章标签：文本解析 python 字符统计

本文链接：https://blog.csdn.net/lzqg1990/article/details/88431372

版权

本文探讨了如何使用Python进行文本处理，包括字符的统计和词汇频率的排序，详细介绍了相关的方法和步骤。

摘要由CSDN通过智能技术生成

一、文本字符统计

fr = open('兰亭集序.txt','rt',encoding='utf-8')
fw = open('兰亭集序-字符统计.txt','wt',encoding='utf-8')
txt_str = fr.read().strip().strip('\n')#不统计空格和回车'\n'

#遍历文本字符串,把字符、数量写入字典键值对
#把字符、数量分别存入列表
##key_list = []
##value_list = []
txt_dict = {}
parse_ls = []
for item in txt_str:
    if item not in txt_dict.keys():
##        key_list.append(item)#列表为可变数据类型
##        value_list.append(txt_str.count(item))
        txt_dict[item] = txt_str.count(item)
    else:
        continue
else:
    print('统计完成！')
        
#是否有把2个列表的元素赋给字典{key:value}={字符:数量}的方法？
#txt_dict[key_list] = value_list

#统计结果写入csv
for key in txt_dict:
    parse_ls.append("{}:{}".format(key,txt_dict[key]))
fw.write(','.join(parse_ls))
print('写入完成！')
fr.close()
fw.close

二、文本词频排序