python统计文本字数_Python 简单应用--文章字数统计

Python是做数据处理很好的工具,这里小时牛刀,用Python完成文章的字数统计。

系统:Ubuntu16.04

Python版本:3.4

文本:《西游记》txt片段

结果:存放于result.csv 中

# 下面两句可以查看使用的字符编码,结果为:utf-8

import sys

print (sys.getdefaultencoding())

fw = open('data.txt.utf8','r')

# character列表:存储所有出现的汉字

# stat字典:汉字为key值,出现次数为value值

characters = []

stat = {}

for line in fw:

line = line.strip()

# 如果某一行去掉空格没有内容,则这一行不做处理

if len(line) == 0:

continue

for x in range(0,len(line)):

# 暴力列举可能出现的标点符号,统计汉字的时候跳过这些符号

if line[x] in [' ','\n','\t',',','。','?','《','》','!','、',':','“','”',';']

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值