Python入门之(6.3)CSV文件

目录

CSV文件

1.1 CSV文件简介

1.2 CSV文件访问

1.3 Excel文件与CSV文件


CSV文件

1.1 CSV文件简介

CSV(逗号分隔值)是一种用来存储表格数据(数字和文本)的纯文本文件,通常是用于存放电子表格或数据的一种文件格式。纯文本意味着该文件是一个字符序列,不包含必须像二进制数字那样被解读的数据。

CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其他字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。

CSV文件可以比较方便地在不同应用之间交换数据。可以将数据批量导出为CSV格式,然后导入到其他应用程序中。很多应用中需要导出报表,也通常采用CSV格式,然后用excel工具进行后续编辑。

如下所示是一个CSV文件:

101,张华,女,1994-03-21,111111111
102,李明,男,1995-05-12,222222222
103,王红,女,1995-04-27,333333333

 

1.2 CSV文件访问

CSV模块是Python的内置模块,用import语句导入后就可以使用。下面是CSV模块中的几个常用方法。

1.reader()方法

语法格式:    csv.reader(csvfile,dialect='excel',**fmtparams)

功能:读取CSV文件。

参数说明:

  1. csvfile 必须是支持迭代(iterator)的对象,可以是文件(file)对象或者列表(list)对象。
  2. dialect 编码风格,默认是excel的风格,用逗号(,)分隔。dialect方式也支持自定义,通过调用register_dialect()方法来注册。
  3. fmtparams 格式化参数,用来覆盖之前dialect对象指定的编码风格。

2.writer()方法

语法格式:     csv.writer(csvfile,dialect='excel',**fmtparams)

功能:写入CSV文件。

参数说明:参数含义同reader()方法。

3.register_dialect()方法

语法格式:    csv.register_dialect(name,[dialect,] **fmtparams)

功能:用来自定义编码风格

参数说明:

  1. name: 自定义编码风格的名字,默认是‘excel’,可以自定义成‘mydialect’
  2. [dialect,] **fmtparams: 编码风格格式参数,如分隔符(默认的就是逗号)或引号等。

4.unregister_dialect()方法

语法格式:    csv.unregister_dialect(name)

功能:用于注销自定义的编码风格。

参数说明:name为自定义的编码风格的名字。

读写CSV文件的示例代码如下:

import csv
def csvWrite():
    filename=input('请输入要保存的文件的路径和文件名:')
    #使用open()函数打开用户输入的文件,如果该文件不存在,创建它
    with open(filename,'w',newline='') as mycsvfile:    #newline=''可防止写入空行
        mywriter=csv.writer(mycsvfile)       #创建CSV文件写对象
        #调用writerow()方法,一次写一行,参数必须是一个列表
        mywriter.writerow(['101','zhanghua','nv','1994-03-21'])
        mywriter.writerow(['102','liming','nan','1995-05-12'])
        mylist=[['104','liuming','nan','1994-06-18'],['103','wanghong','nv','1995-04-27']]
        mywriter.writerows(mylist)
def csvRead():
    filename=input('请输入要打开文件的路径和文件名:')
    #使用open()函数打开用户输入的文件,如果该文件不存在,则报错
    with open(filename,'r') as mycsvfile:
        #使用reader()方法读整个csv文件到一个列表对象中
        lines=csv.reader(mycsvfile)
        for line in lines:
            print(line)
if __name__=='__main__':
    csvWrite()
    csvRead()

运行结果为:

E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入要保存的文件的路径和文件名:e:\shi\tmp.csv
请输入要打开文件的路径和文件名:e:\shi\tmp.csv
['101', 'zhanghua', 'nv', '1994-03-21']
['102', 'liming', 'nan', '1995-05-12']
['104', 'liuming', 'nan', '1994-06-18']
['103', 'wanghong', 'nv', '1995-04-27']

Process finished with exit code 0

上面代码中的with as语句参见Python中with…as的用法

编写一个Python程序,输入行号或列号,可以是多行或多列,输出对应的数据。

设计思路:根据题目要求,首先需要用户输入文件名,以及查找的行号和列号,然后调用查找函数完成。在查找函数中,打开csv文件,并将所有信息读入列表对象。遍历这个列表,找出满足要求的数据并添加到结果列表对象中。最后,返回结果列表。

程序如下:

import csv   #导入csv模块
#定义查找函数,file是要查找的文件名,list1是行号列表,list2是列号列表
def readRowandCol(file,list1,list2):
    #对行号和列号列表排序
    list1.sort()
    list2.sort()
    mylist=[]      #mylist存放从csv文件中读入的信息,初始化为空
    result=[]      #存放筛选后结果的列表,初始化为空
    with open(file,'r') as csvfile:
        #读取csv文件的所有内容,赋值给对象lines
        lines=csv.reader(csvfile)
        #遍历lines对象,每行数据添加到列表mylist中
        for line in lines:
            mylist.append(line)
        rowlen=len(mylist)      #获得列表的行数
        if len(list1)==0:
            #如果用户没有输入任何行号,则默认选择所有行
            list1=[str(x+1) for x in range(rowlen)]
        collen=len(mylist[0])  #获得每个子列表的元素个数
        if len(list2)==0:
            #如果用户没有输入任何列号,则默认选择所有列
            list2=[str(x+1) for x in range(collen)]
        #行号初始化为0
        row=0
        #遍历列表mylist,查找符合条件的行和列
        for line in mylist:
            #如果当前行号在行号列表中,则查找相应的列
            if str(int(row)+1) in list1:
                #tmp初始化为空列表,用于拼接相应的列
                tmp=[]
                #遍历列号列表,添加相应的元素到对象tmp中
                for x in list2:
                    tmp.append(line[int(x)-1])
                result.append(tmp)   #tmp对象添加到结果列表中
            row+=1
    return result  #返回结果列表对象
if __name__=='__main__':
    filename=input('请输入csv文件所在的目录及文件名:')
    rows=input('请输入选择的行号(用空格分隔):')
    cols=input('请输入选择的列号(用空格分隔):')
    list1=rows.split()  #把输入的字符串数据转换为列表对象
    list2=cols.split()
    #调用函数,得到结果列表
    result=readRowandCol(filename,list1,list2)
    print(result)

运行结果为:

E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入csv文件所在的目录及文件名:e:\SHI\tmp.csv
请输入选择的行号(用空格分隔):1 2
请输入选择的列号(用空格分隔):1 2
[['101', 'zhanghua'], ['102', 'liming']]

Process finished with exit code 0

 

1.3 Excel文件与CSV文件

CSV文件是文本形式的表格文件,excel是备受欢迎的专业电子表格处理软件。很多表格是以excel方式存储的。Python中可以导入其他相关库来直接操作excel文件,这里使用xlrd模块和xlwt模块。

这两个模块的安装方法如下:

  1. 在 http://pypi.python.org/pypi/xlwt 和 http://pypi.python.org/pypi/xlrd 下分别下载 xlwt-1.2.0.tar.gz 和 xlrd-1.0.0.tar.gz;
  2. 把下载的两个.gz 包解压,如解压到 d:\DOWNLOAD 下;
  3. 打开 cmd 程序,进入到解压后文件所在的文件夹;
  4. 运行 setup.py install.命令安装完成。

读取excel文件:

读取excel文件使用xlrd模块提供的函数来完成。该模块的常用函数如下:

xlrd模块常用的函数
函数功能描述
data=xlrd.open_workbook('file')打开excel文件file
table=data.sheets()[0]获取一个工作表
table=data.sheet_by_index(0)通过索引顺序获取一个工作表
table=data.sheet_by_name(u'sheet1')通过名称获取一个工作表
names=data.sheet_names()获得所有工作表的名字
table.row_values(i)获取整行的值
table.col_values(i)获取整列的值
nrows=table.nrows获取行数
ncols=table.ncols获取列数
cell_A1=table.cell(0,0).value通过cell函数获取单元格数据
cell_A1=table.row(0)[0].value通过行索引获取单元格数据
cell_A2=table.col(1)[0].value通过列索引获取单元格数据

写excel文件:

写入excel文件使用xlwt模块提供的函数来完成。该模块常用函数见下表:

xlwt模块常用函数
函数用法功能描述
f=xlwt.Workbook()创建工作簿对象
sheet=f.add_sheet('grade')创建一个名为grade的工作表
sheet.write(0,0,'hao123')在工作表指定单元格写入数据
f.save(r'd:\temp\mytest.xls')保存工作簿
f.insert_bitmap('p1.bmp',2,2)在指定单元格位置插入图片
f.row(i).set_style(style)对第i行设置样式style

编写一个Python程序,实现excel文件与csv文件的相互转换。

设计思路:

根据题目要求,设计两个函数,其中一个函数用来完成csv文件到excel文件的转换,另外一个函数用来完成excel文件到csv文件的转换并把excel文件中的每张工作表转换为一个单独的以工作表名称命名的csv文件。使用xlwt模块和xlrd模块提供的方法来完成。

程序如下:

import csv   #导入csv模块
import xlwt
import xlrd
import sys
import os
#csv文件转换成excel文件
def csvtoExcel(csvfile,excelfile):
    #新建excel工作簿
    myexcel=xlwt.Workbook()
    #新建工作簿中的一个表单,名字为mysheet
    mysheet=myexcel.add_sheet('mysheet')
    #用只读方式打开csv文件,r之后不要加b
    csvfile=open(csvfile,'r')
    #读取文件信息到对象reader中
    reader=csv.reader(csvfile)
    #行号初始化为0
    row=0
    #按行遍历读取的对象
    for line in reader:
        #列号初始化为0
        col=0
        #遍历每行的每列元素
        for item in line:
            #把遍历到的元素写入到excel工作表的相应单元格
            mysheet.write(row,col,item)
            col+=1
        row+=1
    #保存工作簿文件
    myexcel.save(excelfile)
    print('转换完成')
#excel文件转换为csv文件
def exceltoCsv(excel_file,csv_filedir):
    #打开指定的excel工作簿文件
    workbook=xlrd.open_workbook(excel_file)
    #获取所有工作簿的名字
    all_worksheets=workbook.sheet_names()
    #遍历每张工作表,分别转换为一个csv文件
    for worksheet_name in all_worksheets:
        #获取当前工作表内容
        worksheet=workbook.sheet_by_name(worksheet_name)
        #在指定文件下打开以工作表命名的csv文件,用于写操作
        csv_file=open(os.path.join(csv_filedir,worksheet_name+'.csv'),'w')
        #获得csv文件的写对象
        wr=csv.writer(csv_file,quoting=csv.QUOTE_ALL)
        #逐行写入csv文件
        for rownum in range(worksheet.nrows):
            wr.writerow([entry for entry in worksheet.row_values(rownum)])
        #关闭csv文件
        csv_file.close()
    print('转换完成')
#以上两个函数的测试代码
if __name__=='__main__':
    print('请输入转换方向:')
    print('1.csv文件转换为excel文件')
    print('2.excel文件转换为csv文件')
    print('3.退出')
    choice=int(input('请输入你的选择:'))
    if choice==1:
        csvfilename=input('请输入csv文件名(包括路径):')
        excelfilename=input('请输入excel文件名(包括路径):')
        csvtoExcel(csvfilename,excelfilename)
    elif choice==2:
        excelfilename=input('请输入excel文件名(包括路径):')
        csvfiledir=input('请输入存放转换后csv文件的文件夹:')
        exceltoCsv(excelfilename,csvfiledir)
    else:
        exit(0)

运行结果如下:

E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入转换方向:
1.csv文件转换为excel文件
2.excel文件转换为csv文件
3.退出
请输入你的选择:2
请输入excel文件名(包括路径):E:\SHI\tmp.xls
请输入存放转换后csv文件的文件夹:E:\SHI\excel_to_csv
转换完成

Process finished with exit code 0

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值