文件和数据格式化-课堂练习
一、单项选择题
1、给定列表ls =[1, 2, 3, “1”, “2”, “3”],其元素包含两种数据类型,则ls的数据组织维度是
- A 多维数据
- B 高维数据
- C 二维数据
- D 一维数据
【答案】D
【解析】暂无解析
2、给定字典d = {1:“1”, 2:“2”, 3: “3”},其元素包含两种数据类型,则字典d的数据组织维度是
- A 一维数据
- B 高维数据
- C 多维数据
- D 二维数据
【答案】B
【解析】暂无解析
3、以下选项中,对CSV格式的描述正确的是
-
A CSV文件以英文空格分隔元素
-
B CSV文件以英文分号分隔元素
-
C CSV文件以英文逗号分隔元素
-
D CSV文件以英文特殊符号分隔元素
【答案】C
【解析】暂无解析
4、表达式",".join(ls)中ls是列表类型,以下选项中对其功能的描述正确的是
-
A 将逗号字符串增加到列表ls中
-
B 在列表ls每个元素后增加一个逗号
-
C 将列表所有元素连接成一个字符串,元素之间增加一个逗号
-
D 将列表所有元素连接成一个字符串,每个元素后增加一个逗号
【答案】C
【解析】暂无解析
5、以下选项对应的方法可以用于从CSV文件中解析一二维数据的是
-
A format()
-
B exists()
-
C join()
-
D split()
【答案】D
【解析】暂无解析
6、二维列表ls=[[1,2,3], [4,5,6],[7,8,9]],以下选项中能获取其中一个维度的数据是
-
A ls
[–1][ –1]
-
B ls
[–2][–1]
-
C ls
[1][1]
-
D ls
[–1]
【答案】D
【解析】暂无解析
二、程序设计题
1、《白鹿原》词频统计
类型:Python 文件
附件是《白鹿原》原著内容,请读入内容,分词后输出长度大于 2 且最多的单词。
如果存在多个单词出现频率一致,请输出按照 Unicode 排序后最大的单词。
**示例1:**
输入:无
输出:"白鹿原"
注意:示例1 是一个输入输出示范样例,不是正确结果
代码:
# -*- coding = utf-8 -*-
# @Author:为一道彩虹
import jieba
if __name__ == '__main__':
# 打开文件
f = open("白鹿原.txt")
# 对文本进行分词
ls = jieba.lcut(f.read())
# 创建空字典,用于存储词频统计结果
d = {}
# 统计词频
for w in ls:
d[w] = d.get(w, 0) + 1
# 初始化最高词频和对应的词
maxc = 0
maxw = ""
# 遍历词频字典,找到词频最高的词
for k in d:
if d[k] > maxc and len(k) > 2:
maxc = d[k]
maxw = k
# 如果有多个词频相同的词,选择词长度大于2且字典序最大的词
if d[k] == maxc and len(k) > 2 and k > maxw:
maxw = k
# 输出词频最高的词
print(maxw)
# 关闭文件
f.close()
2、CSV 格式数据清洗
类型:Python 文件
附件是一个 CSV 文件,其中每个数据前后存在空格,请对其进行清洗,要求如下:
- 去掉每个数据前后空格,即数据之间仅用逗号 (,) 分割;
- 清洗后打印输出。
**示例1:**
输入:"
1, 2, 3, 4, 5
'a', 'b' , 'c' , 'd','e'
"
输出:"
1,2,3,4,5
'a','b','c','d','e'
"
**注意:**
- 示例1 是一个格式示例,不是正确结果;
- 该题输入是读取附件中的数据
代码:
# -*- coding = utf-8 -*-
# @Author:为一道彩虹
if __name__ == '__main__':
# 打开名为"data.csv"的文件
f = open("data.csv")
# 读取文件内容
s = f.read()
# 将文件内容中的空格替换为空字符串
s = s.replace(" ", "")
# 打印处理后的字符串
print(s)
# 关闭文件
f.close()
3、文本字符分布
类型:Python 文件
分析附件 data.txt 文件的字符分布,即每个字符对应的数量。
按照 字符:数量
显示,每行一个结果,如果没有出现该字节则不显示输出,字符采用 Unicode 编码升序排列。
**示例1:**
输入:无
输出:"
a:1
b:2
c:3
"
注意:
- 示例1 是一个输入输出示范样例,不是正确结果;
字符:数量
,其中,字符表示为可打印字符,按照升序。
代码:
# -*- coding = utf-8 -*-
# @Author:为一道彩虹
if __name__ == '__main__':
# 打开名为"data.txt"的文件
f = open("data.txt")
# 读取文件内容
txt = f.read()
# 创建一个空字典用于存储字符及其出现次数的统计
d = {}
# 遍历文件中的每个字符,并统计其出现次数
for w in txt:
d[w] = d.get(w, 0) + 1
# 将字典转换为列表,并按键排序
ls = list(d.items())
ls.sort()
# 遍历排序后的列表,输出字符及其出现次数
for k, c in ls:
print("{}:{}".format(k, c))
# 关闭文件
f.close()
先赞后看,养成习惯!!!^ _ ^ ❤️ ❤️ ❤️
码字不易,大家的支持就是我的坚持下去的动力。点赞后不要忘了关注我哦!