目录
CSV文件
1.1 CSV文件简介
CSV(逗号分隔值)是一种用来存储表格数据(数字和文本)的纯文本文件,通常是用于存放电子表格或数据的一种文件格式。纯文本意味着该文件是一个字符序列,不包含必须像二进制数字那样被解读的数据。
CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其他字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
CSV文件可以比较方便地在不同应用之间交换数据。可以将数据批量导出为CSV格式,然后导入到其他应用程序中。很多应用中需要导出报表,也通常采用CSV格式,然后用excel工具进行后续编辑。
如下所示是一个CSV文件:
101,张华,女,1994-03-21,111111111
102,李明,男,1995-05-12,222222222
103,王红,女,1995-04-27,333333333
1.2 CSV文件访问
CSV模块是Python的内置模块,用import语句导入后就可以使用。下面是CSV模块中的几个常用方法。
1.reader()方法
语法格式: csv.reader(csvfile,dialect='excel',**fmtparams)
功能:读取CSV文件。
参数说明:
- csvfile 必须是支持迭代(iterator)的对象,可以是文件(file)对象或者列表(list)对象。
- dialect 编码风格,默认是excel的风格,用逗号(,)分隔。dialect方式也支持自定义,通过调用register_dialect()方法来注册。
- fmtparams 格式化参数,用来覆盖之前dialect对象指定的编码风格。
2.writer()方法
语法格式: csv.writer(csvfile,dialect='excel',**fmtparams)
功能:写入CSV文件。
参数说明:参数含义同reader()方法。
3.register_dialect()方法
语法格式: csv.register_dialect(name,[dialect,] **fmtparams)
功能:用来自定义编码风格
参数说明:
- name: 自定义编码风格的名字,默认是‘excel’,可以自定义成‘mydialect’
- [dialect,] **fmtparams: 编码风格格式参数,如分隔符(默认的就是逗号)或引号等。
4.unregister_dialect()方法
语法格式: csv.unregister_dialect(name)
功能:用于注销自定义的编码风格。
参数说明:name为自定义的编码风格的名字。
读写CSV文件的示例代码如下:
import csv
def csvWrite():
filename=input('请输入要保存的文件的路径和文件名:')
#使用open()函数打开用户输入的文件,如果该文件不存在,创建它
with open(filename,'w',newline='') as mycsvfile: #newline=''可防止写入空行
mywriter=csv.writer(mycsvfile) #创建CSV文件写对象
#调用writerow()方法,一次写一行,参数必须是一个列表
mywriter.writerow(['101','zhanghua','nv','1994-03-21'])
mywriter.writerow(['102','liming','nan','1995-05-12'])
mylist=[['104','liuming','nan','1994-06-18'],['103','wanghong','nv','1995-04-27']]
mywriter.writerows(mylist)
def csvRead():
filename=input('请输入要打开文件的路径和文件名:')
#使用open()函数打开用户输入的文件,如果该文件不存在,则报错
with open(filename,'r') as mycsvfile:
#使用reader()方法读整个csv文件到一个列表对象中
lines=csv.reader(mycsvfile)
for line in lines:
print(line)
if __name__=='__main__':
csvWrite()
csvRead()
运行结果为:
E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入要保存的文件的路径和文件名:e:\shi\tmp.csv
请输入要打开文件的路径和文件名:e:\shi\tmp.csv
['101', 'zhanghua', 'nv', '1994-03-21']
['102', 'liming', 'nan', '1995-05-12']
['104', 'liuming', 'nan', '1994-06-18']
['103', 'wanghong', 'nv', '1995-04-27']
Process finished with exit code 0
上面代码中的with as语句参见Python中with…as的用法。
编写一个Python程序,输入行号或列号,可以是多行或多列,输出对应的数据。
设计思路:根据题目要求,首先需要用户输入文件名,以及查找的行号和列号,然后调用查找函数完成。在查找函数中,打开csv文件,并将所有信息读入列表对象。遍历这个列表,找出满足要求的数据并添加到结果列表对象中。最后,返回结果列表。
程序如下:
import csv #导入csv模块
#定义查找函数,file是要查找的文件名,list1是行号列表,list2是列号列表
def readRowandCol(file,list1,list2):
#对行号和列号列表排序
list1.sort()
list2.sort()
mylist=[] #mylist存放从csv文件中读入的信息,初始化为空
result=[] #存放筛选后结果的列表,初始化为空
with open(file,'r') as csvfile:
#读取csv文件的所有内容,赋值给对象lines
lines=csv.reader(csvfile)
#遍历lines对象,每行数据添加到列表mylist中
for line in lines:
mylist.append(line)
rowlen=len(mylist) #获得列表的行数
if len(list1)==0:
#如果用户没有输入任何行号,则默认选择所有行
list1=[str(x+1) for x in range(rowlen)]
collen=len(mylist[0]) #获得每个子列表的元素个数
if len(list2)==0:
#如果用户没有输入任何列号,则默认选择所有列
list2=[str(x+1) for x in range(collen)]
#行号初始化为0
row=0
#遍历列表mylist,查找符合条件的行和列
for line in mylist:
#如果当前行号在行号列表中,则查找相应的列
if str(int(row)+1) in list1:
#tmp初始化为空列表,用于拼接相应的列
tmp=[]
#遍历列号列表,添加相应的元素到对象tmp中
for x in list2:
tmp.append(line[int(x)-1])
result.append(tmp) #tmp对象添加到结果列表中
row+=1
return result #返回结果列表对象
if __name__=='__main__':
filename=input('请输入csv文件所在的目录及文件名:')
rows=input('请输入选择的行号(用空格分隔):')
cols=input('请输入选择的列号(用空格分隔):')
list1=rows.split() #把输入的字符串数据转换为列表对象
list2=cols.split()
#调用函数,得到结果列表
result=readRowandCol(filename,list1,list2)
print(result)
运行结果为:
E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入csv文件所在的目录及文件名:e:\SHI\tmp.csv
请输入选择的行号(用空格分隔):1 2
请输入选择的列号(用空格分隔):1 2
[['101', 'zhanghua'], ['102', 'liming']]
Process finished with exit code 0
1.3 Excel文件与CSV文件
CSV文件是文本形式的表格文件,excel是备受欢迎的专业电子表格处理软件。很多表格是以excel方式存储的。Python中可以导入其他相关库来直接操作excel文件,这里使用xlrd模块和xlwt模块。
这两个模块的安装方法如下:
- 在 http://pypi.python.org/pypi/xlwt 和 http://pypi.python.org/pypi/xlrd 下分别下载 xlwt-1.2.0.tar.gz 和 xlrd-1.0.0.tar.gz;
- 把下载的两个.gz 包解压,如解压到 d:\DOWNLOAD 下;
- 打开 cmd 程序,进入到解压后文件所在的文件夹;
- 运行 setup.py install.命令安装完成。
读取excel文件:
读取excel文件使用xlrd模块提供的函数来完成。该模块的常用函数如下:
函数 | 功能描述 |
data=xlrd.open_workbook('file') | 打开excel文件file |
table=data.sheets()[0] | 获取一个工作表 |
table=data.sheet_by_index(0) | 通过索引顺序获取一个工作表 |
table=data.sheet_by_name(u'sheet1') | 通过名称获取一个工作表 |
names=data.sheet_names() | 获得所有工作表的名字 |
table.row_values(i) | 获取整行的值 |
table.col_values(i) | 获取整列的值 |
nrows=table.nrows | 获取行数 |
ncols=table.ncols | 获取列数 |
cell_A1=table.cell(0,0).value | 通过cell函数获取单元格数据 |
cell_A1=table.row(0)[0].value | 通过行索引获取单元格数据 |
cell_A2=table.col(1)[0].value | 通过列索引获取单元格数据 |
写excel文件:
写入excel文件使用xlwt模块提供的函数来完成。该模块常用函数见下表:
函数用法 | 功能描述 |
f=xlwt.Workbook() | 创建工作簿对象 |
sheet=f.add_sheet('grade') | 创建一个名为grade的工作表 |
sheet.write(0,0,'hao123') | 在工作表指定单元格写入数据 |
f.save(r'd:\temp\mytest.xls') | 保存工作簿 |
f.insert_bitmap('p1.bmp',2,2) | 在指定单元格位置插入图片 |
f.row(i).set_style(style) | 对第i行设置样式style |
编写一个Python程序,实现excel文件与csv文件的相互转换。
设计思路:
根据题目要求,设计两个函数,其中一个函数用来完成csv文件到excel文件的转换,另外一个函数用来完成excel文件到csv文件的转换并把excel文件中的每张工作表转换为一个单独的以工作表名称命名的csv文件。使用xlwt模块和xlrd模块提供的方法来完成。
程序如下:
import csv #导入csv模块
import xlwt
import xlrd
import sys
import os
#csv文件转换成excel文件
def csvtoExcel(csvfile,excelfile):
#新建excel工作簿
myexcel=xlwt.Workbook()
#新建工作簿中的一个表单,名字为mysheet
mysheet=myexcel.add_sheet('mysheet')
#用只读方式打开csv文件,r之后不要加b
csvfile=open(csvfile,'r')
#读取文件信息到对象reader中
reader=csv.reader(csvfile)
#行号初始化为0
row=0
#按行遍历读取的对象
for line in reader:
#列号初始化为0
col=0
#遍历每行的每列元素
for item in line:
#把遍历到的元素写入到excel工作表的相应单元格
mysheet.write(row,col,item)
col+=1
row+=1
#保存工作簿文件
myexcel.save(excelfile)
print('转换完成')
#excel文件转换为csv文件
def exceltoCsv(excel_file,csv_filedir):
#打开指定的excel工作簿文件
workbook=xlrd.open_workbook(excel_file)
#获取所有工作簿的名字
all_worksheets=workbook.sheet_names()
#遍历每张工作表,分别转换为一个csv文件
for worksheet_name in all_worksheets:
#获取当前工作表内容
worksheet=workbook.sheet_by_name(worksheet_name)
#在指定文件下打开以工作表命名的csv文件,用于写操作
csv_file=open(os.path.join(csv_filedir,worksheet_name+'.csv'),'w')
#获得csv文件的写对象
wr=csv.writer(csv_file,quoting=csv.QUOTE_ALL)
#逐行写入csv文件
for rownum in range(worksheet.nrows):
wr.writerow([entry for entry in worksheet.row_values(rownum)])
#关闭csv文件
csv_file.close()
print('转换完成')
#以上两个函数的测试代码
if __name__=='__main__':
print('请输入转换方向:')
print('1.csv文件转换为excel文件')
print('2.excel文件转换为csv文件')
print('3.退出')
choice=int(input('请输入你的选择:'))
if choice==1:
csvfilename=input('请输入csv文件名(包括路径):')
excelfilename=input('请输入excel文件名(包括路径):')
csvtoExcel(csvfilename,excelfilename)
elif choice==2:
excelfilename=input('请输入excel文件名(包括路径):')
csvfiledir=input('请输入存放转换后csv文件的文件夹:')
exceltoCsv(excelfilename,csvfiledir)
else:
exit(0)
运行结果如下:
E:\PycharmProjects\PythonTest\venv\Scripts\python.exe E:/PycharmProjects/PythonTest/ssss.py
请输入转换方向:
1.csv文件转换为excel文件
2.excel文件转换为csv文件
3.退出
请输入你的选择:2
请输入excel文件名(包括路径):E:\SHI\tmp.xls
请输入存放转换后csv文件的文件夹:E:\SHI\excel_to_csv
转换完成
Process finished with exit code 0