CSV 格式数据清洗
类型:Python 文件
附件是一个 CSV 文件,其中每个数据前后存在空格,请对其进行清洗,要求如下:
- 去掉每个数据前后空格,即数据之间仅用逗号 (,) 分割;
- 清洗后打印输出。
示例1:
输入:"
1, 2, 3, 4, 5
'a', 'b' , 'c' , 'd','e'
"
输出:"
1,2,3,4,5
'a','b','c','d','e'
"
注意:
- 示例1 是一个格式示例,不是正确结果;
- 该题输入是读取附件中的数据。
with open("data.csv","r") as fp:#打开文件
for line in fp:#按行遍历
line = line.replace(" ", "")#将空格替换为""
print(line, end="")#按行输出
文本字符分布
类型:Python 文件
分析附件 data.txt 文件的字符分布,即每个字符对应的数量。
按照 字符:数量
显示,每行一个结果,如果没有出现该字节则不显示输出,字符采用 Unicode 编码升序排列。
示例1:
输入:无
输出:"
a:1
b:2
c:3
"
注意:
- 示例1 是一个输入输出示范样例,不是正确结果;
字符:数量
,其中,字符表示为可打印字符,按照升序。
d = {}
with open("data.txt","r") as fp:#打开文件
for line in fp:#统计字符
for item in line:
d[item] = d.get(item,0) + 1
keys = sorted(d)#排序,注意!!!!!!!
#字典排序返回的是一个列表
for key in keys:#遍历输出
print(key +':'+ str(d[key]))
《白鹿原》词频统计
类型:Python 文件
附件是《白鹿原》原著内容,请读入内容,分词后输出长度大于 2 且最多的单词。