python第七周项目_练习7: 文件和数据格式化 (第7周)-CSDN博客

文件行数

描述

打印输出附件文件的有效行数，注意：空行不计算为有效行数。

f = open("latex.log")

s = 0

for line in f:

line = line.strip('\n')

if len(line) == 0:

continue

s += 1

print("共{}行".format(s))1

注意：for line in f方式获得的每行内容(在变量line中)包含换行符，所以，要通过strip()函数去掉换行符后再进行统计。这里，空行指没有字符的行。

——————————————————————————————————

文件字符分布

描述

统计附件文件的小写字母a-z的字符分布，即出现a-z字符的数量，并输出结果。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

同时请输出文件一共包含的字符数量。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

注意输出格式，各元素之间用英文逗号(,)分隔。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

答案可能包含a-z共26个字符的分布，如果某个字符没有出现，则不显示，输出顺序a-z顺序。

f = open("latex.log")

cc = 0

d = {}

for i in range(26):

d[chr(ord('a')+i)] = 0

for line in f:

for c in line:

d[c] = d.get(c, 0) + 1

cc += 1

print("共{}字符".format(cc), end="")

for i in range(26):

print(",{}:{}".format(chr(ord('a')+i), d[chr(ord('a')+i)]), end="")1

使用 ord(‘a’)+i 配合 range()函数可以遍历一个连续的字符表。

——————————————————————————————————

文件独特行数

描述

统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。

f = open("latex.log")

ls = f.readlines()

s = set(ls)

for i in s:

ls.remove(i)

t = set(ls)

print("共{}独特行".format(len(s)-len(t)))1

如果需要"去重"功能，请使用集合类型。

ls.remove()可以去掉某一个元素，如果该行是独特行，去掉该元素后将不在集合t中出现。

——————————————————————————————————

9748

CSV格式列变换

描述

附件是一个CSV文件，请将每行按照列逆序排列后输出，不改变各元素格式(如周围空格布局等)。

f = open("data.csv")

for line in f:

line = line.strip("\n")

ls = line.split(",")

ls = ls[::-1]

print(",".join(ls))

f.close()1

——————————————————————————————————

83230

CSV格式数据清洗

描述

附件是一个CSV文件，其中每个数据前后存在空格，请对其进行清洗，要求如下：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

(1)去掉每个数据前后空格，即数据之间仅用逗号(,)分割；‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

(2)清洗后打印输出。

f = open("data.csv")

s = f.read()

s = s.replace(" ","")

print(s)

f.close()1

该CSV文件的每个数据中不包含空格，因此，可以通过替换空格方式来清洗。如果数据中包含空格，该方法则不适用。

欢迎关注我的公众号【panda一块砖】，更新更多编程相关文章与资源。