Python练习(四)

目录

CSV 格式数据清洗

十二星座

习题


CSV 格式数据清洗

附件是一个 CSV 文件,其中每个数据前后存在空格,请对其进行清洗,要求如下:

1.去掉每个数据前后空格,即数据之间仅用逗号 (,) 分割;

2.清洗后打印输出

示例1:

输入:" 1, 2, 3, 4, 5 'a', 'b' , 'c' , 'd','e' "

输出:" 1,2,3,4,5 'a','b','c','d','e' "

注意:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

  • 示例1 是一个格式示例,不是正确结果;
  • 该题输入是读取附件中的数据。
with open('data.csv') as f:
    for line in f:
        print(line.replace(' ',''),end='')

replace() 

str.replace(old, new[, max])

old:将被替换的子字符串。

new:新字符串,用于替换old子字符串。

max:可选字符串, 替换不超过 max 次

>>> str = "this is string example....wow!!! this is really string";
>>> print str.replace("is", "was");
thwas was string example....wow!!! thwas was really string
>>> print str.replace("is", "was", 3);
thwas was string example....wow!!! thwas is really string

ps:string的replace方法,需要注意replace不会改变原 string 的内容

十二星座

古代航海人为了方便在航海时辨别方位和观测天象,将散布在天上的星星运用想象力将它们连接起来,有一半是在古时候已命名,另一半是近代开始命名的。两千多年前古希腊的天文学家希巴克斯命名十二星座,依次为白羊座、金牛座、双子座、巨蟹座、狮子座、处女座、天秤座、天蝎座、射手座、魔蝎座、水瓶座和双鱼座。给出二维数据存储 CSV 文件(SunSign.csv),内容如下:

星座,开始月日,结束月日,Unicode  

水瓶座,120,218,9810

双鱼座,219,320,9811

白羊座,321,419,9800

金牛座,420,520,9801

双子座,521,621,9802

巨蟹座,622,722,9803

狮子座,723,822,9804

处女座,823,922,9805

天秤座,923,1023,9806

天蝎座,1024,1122,9807

射手座,1123,1221,9808

魔蝎座,1222,119,9809

请编写程序,读入 CSV 文件中数据,循环获得用户输入,直至用户输入 "exit" 退出。根据用户输入的星座名称,输出此星座的出生日期范围及对应字符形式。如果输入的星座名称有误,请输出“输入星座名称有误!”。

示例1:

输入:"

白羊座

金牛座

双子座

exit

"

输出:"

♈座的生日位于321-419之间

♉座的生日位于420-520之间

♊座的生日位于521-621之间

"

注意:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

  • 输入使用 input(),不要增加额外的提示信息;
  • 从附件中读取 utf-8 编码文本数据。
dic={}
with open('SunSign.csv') as f:
    for line in f:
        dic[line.split(',')[0]]=line.split(',')[1:4]

_input=input()
data=[]
while _input!="exit":
    data.append(_input)
    _input=input()

for i in data:
    if i not in dic.keys() :
        print('输入星座名称有误!')
    else :
        print(chr(int(dic[i][2])) +"座的生日位于"+dic[i][0]+"-"+dic[i][1]+"之间")

chr()

返回整数i所对应的Unicode字符,功能与ord()函数相反

>>> chr(97)
a
>>> ord(a)
97

习题

1.数据清洗

将data.json文件换成CSV格式,并以“花瓣长度/花瓣宽”降序度排序,保存到文件中。

import json
import csv
json_file=open('data.json','rb')
csv_file=open('data.csv','w',newline='')
item_list=json.loads(json_file.read().decode("gbk").encode("utf-8"))

key_data=item_list[0].keys()
value_data=[item.values() for item in item_list]

csv_writer=csv.writer(csv_file)
csv_writer.writerow(key_data)
csv_writer.writerows(value_data)

json_file.close()
csv_file.close()

使用csv库将json文件换成csv格式

csv.writer():创建csv文件写入对象(以下假设为csv_object

csv_object.writerow():将列表全部写入csv的同一行

csv_object.writerows():将二维列表中的每个列表写为一

ps:使用writerow()写入csv文件时,行间会出现空行,应在open()中添加参数newline=''

2.更新课本例13,尝试转化data.csv文件,设计能够自适应csv不同行列数(例13是固定的6行4列) 

start='''<!DOCTYPE HTML>
<html>
<head>
<meta charset=utf-8>
</head>
<body>
<table border="1">
<tr>'''
end='''
</table>
</body>
</html>'''
ls = []
with open('data.csv','r') as _f:
    for line in _f :
        ls.append(line.replace('\n','').split(','))
    print(ls)

with open('data.html','w') as f:
    f.write(start)
    for i in ls[0]:
        f.write('<th>{}</th>'.format(i))
    f.write('</tr>\n')
    for i in ls[1:]:
        cnt=0
        for j in i:
            if cnt==0:
                f.write('<tr>')
            f.write('<th>{}</th>'.format(j))
            cnt+=1
            if cnt==len(i) :
                if i==ls[-1]:
                    f.write('</tr>')
                else:
                    f.write('</tr>\n')
    f.write(end)

3.P211制作英文学习词典。 

转自博客:https://blog.csdn.net/qq_52988674/article/details/120735006 

words = {}
count = 0
with open('dict.txt', 'w+') as f:
    for line in f.readlines():
        s = str(line).split()
        words[s[0]] = s[1]
        count += 1

while True:
    option = eval(input("********************"
                        "\n1  添加\n2  查询\n3  退出\n"
                        "********************\n"))
    if option == 1:
        english = input("请输入英文单词: ")
        if english in words:
            print("该单词已经添加到词典里!")
            option_1 = eval(input("是否继续为{}添加多重释义,1为继续添加,2为输入其他选项,3为退出。".format(english)))
            if option_1 == 1:
                chinese = input("请输入中文释义:")
                words[english] = words[english] + "," + chinese
            elif option_1 == 2:
                continue
            elif option_1 == 3:
                break
            else:
                print("输入有误!")
                continue
        else:
            chinese = input("请输入中文释义: ")
            words[english] = chinese
            count += 1
    elif option == 2:
        english = input("请输入你要查询的英文单词:")
        if english not in words:
            print("字典库中未找到这个单词!")
            continue
        else:
            print("{}的中文释义是:{}".format(english, words[english]))
    elif option == 3:
        break
    else:
        print("输入有误")
        break

items = list(words.items())
fo = open("dict.txt", "w")
for i in range(count):
    english, chinese = items[i]
    s = english + " " + chinese + '\n'
    fo.write(s)
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值