关于python统计文件中word的大小

如果一个文件中有很多word,我们需要知道每个word的大小,但是实际中,我们只知道每个文件的大小,至于word的大小我们就需要统计了!!

 

我把word输入进去一个个测试

file.write('\n%s\t'%word) 

由于\t是制表格符,所以每次向文件中写入word的时候,它总是在末尾多余一个空格,如果当你简单用word长度乘以每个字符所占的字节,当然和整个文件的总大小不匹配!

file.write('\n%s'%word) 

于是去掉\t,每一行都是直接以word最后一个字符为结束,但是此时仍然不匹配,因为\n, 分行符号占用两个字节,这个一定要计算进去!简单地来说,如果您的文件有五行那就消耗了四个分行符号,占用了8个字节!对于word的每一个字符占用一个字节!

 

文件大小分成两部分:

  • 每个word所占用的字节数(count(word)*len(word)
  • 分行符号的字节数 (2*(N-1))N是总的行数

这个过程中,如果粗心没有注意到一些空格,分行,极有可能你统计的字节数和文件大小不符合,导致实验不顺利,希望大家从这篇文章中,再也不用为统计文件的word大小而担忧了!

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值