0024-python学习笔记：数据处理训练

九九九九为功

已于 2022-04-18 10:09:28 修改

阅读量616

点赞数

分类专栏：学习笔记文章标签： python

于 2022-04-18 08:49:42 首次发布

本文链接：https://blog.csdn.net/m0_68750710/article/details/124240593

版权

1.文件字符分布

统计附件文件的小写字母a-z的字符分布，即出现a-z字符的数量，并输出结果。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

同时请输出文件一共包含的字符数量。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

注意输出格式，各元素之间用英文逗号（,）分隔。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

答案可能包含a-z共26个字符的分布，如果某个字符没有出现，则不显示，输出顺序a-z顺序。

f = open("latex.log")
cc = 0
d = {}
for i in range(26):
    d[chr(ord('a')+i)] = 0
for line in f:
    for c in line:
        d[c] = d.get(c, 0) + 1
        cc += 1
print("共{}字符".format(cc), end="")
for i in range(26):
    if d[chr(ord('a')+i)] != 0:
        print(",{}:{}".format(chr(ord('a')+i), d[chr(ord('a')+i)]), end="")

注意：任何可以被描述的重复计算都可以用计算机自动运行，字母的遍历赋值就是一个例子。

2.输出文章的有效行数

打印输出附件文件的有效行数，注意：空行不计算为有效行数。

txt = open('latex.log','r',encoding = 'utf-8').readlines()
count = 0
for line in txt:
    line = line.strip('\n')      #这里的意思是删除空行
    if len(line) != 0:
        count = count + 1
print("共{}行".format(count))

注意：空行的标记就是只有一个换行符，那么删除他再统计就是有效行数了

3.文件独特行

统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。

f = open("latex.log")
ls = f.readlines()
s = se

最低0.47元/天解锁文章

九九九九为功

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
0024-python学习笔记：数据处理训练

数据处理需要大量训练熟悉后才能更好的应用
复制链接

扫一扫

专栏目录