一、介绍
csv 模块是 Python 标准库中用于处理 CSV(逗号分隔值)文件的模块。CSV 文件是一种常见的文本文件格式,用于存储表格数据,Python 的内置模块,无需额外安装
二、基本使用
import csv
with open('test.csv','w',newline='') as csv_file:
writer= csv.writer(csv_file)
writer.writerow(['id', 'name', 'age'])
writer.writerow(['10001', 'Mike', 20])
writer.writerow(['10002', 'Bob', 22])
writer.writerow(['10003', 'Jordan', 21])
三、方法和属性
- csv.reader(csvfile, dialect=‘excel’, **fmtparams):创建一个 reader 对象,用于从 CSV 文件中逐行读取数据
- csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
- dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
- **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
- delimiter:字段分隔符的字符,默认为逗号(,)
- quotechar:引号字符,默认为双引号(")
- quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
- escapechar:转义字符,默认为无
- doublequote:是否将引号字符双写,默认为True
- lineterminator:行终止符的字符,默认为系统的默认行终止符
- skipinitialspace:是否跳过字段前的空格,默认为False
- strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
import csv with open('test.csv','r',newline='') as csv_file: reader = csv.reader(csv_file) for item in reader: print(item)
- csv.DictReader(csvfile, dialect=‘excel’, **fmtparams):用于从CSV文件中读取数据,并将每一行数据转换为字典形式
- csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
- dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
- **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
- delimiter:字段分隔符的字符,默认为逗号(,)
- quotechar:引号字符,默认为双引号(")
- quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
- escapechar:转义字符,默认为无
- doublequote:是否将引号字符双写,默认为True
- lineterminator:行终止符的字符,默认为系统的默认行终止符
- skipinitialspace:是否跳过字段前的空格,默认为False
- strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
- csv.writer(csvfile, dialect=‘excel’, **fmtparams):创建一个 writer 对象,用于将数据逐行写入 CSV 文件
- csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
- dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
- **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
- delimiter:字段分隔符的字符,默认为逗号(,)
- quotechar:引号字符,默认为双引号(")
- quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
- escapechar:转义字符,默认为无
- doublequote:是否将引号字符双写,默认为True
- lineterminator:行终止符的字符,默认为系统的默认行终止符
- skipinitialspace:是否跳过字段前的空格,默认为False
- strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
- csv.DictWriter(csvfile, fieldnames, restval=‘’, extrasaction=‘raise’, dialect=‘excel’, **fmtparams) 将字典数据写入CSV文件,返回DictWriter对象
- csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象
- fieldnames:一个字符串列表,指定CSV文件的列名。列表中的每个字符串对应一个列名。列名的顺序将决定CSV文件中列的顺序
- restval:可选参数,指定当字典中缺少某个键时,该键对应的默认值。默认为空字符串
- extrasaction:可选参数,指定当字典中存在额外的键时的处理方式。默认为’raise’,表示引发ValueError异常。还可以设置为’ignore’,表示忽略额外的键
- dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。可以使用标准的方言名称(如’excel’、‘excel-tab’、'unix’等),也可以创建自定义方言对象
- **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
- delimiter:字段分隔符的字符,默认为逗号(,)
- quotechar:引号字符,默认为双引号(")
- quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
- escapechar:转义字符,默认为无
- doublequote:是否将引号字符双写,默认为True
- lineterminator:行终止符的字符,默认为系统的默认行终止符
- skipinitialspace:是否跳过字段前的空格,默认为False
- strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
- csv.register_dialect(name, dialect=None, **fmtparams):注册一个新的 CSV 方言,或者更新现有方言的参数
- csv.unregister_dialect(name):取消注册指定名称的 CSV 方言
- csv.get_dialect(name):返回指定名称的 CSV 方言对象
- csv.list_dialects():返回所有已注册的 CSV 方言的名称列表
- csv.field_size_limit([new_limit]):获取或设置解析 CSV 文件时字段大小的限制
- csv.QUOTE_ALL:引用所有字段的常量,用于写入 CSV 文件时将所有字段都放在引号中
- csv.QUOTE_MINIMAL:最小引用常量,用于写入 CSV 文件时只在必要时才引用字段
- csv.QUOTE_NONNUMERIC:非数字引用常量,用于写入 CSV 文件时将非数字字段放在引号中
- csv.QUOTE_NONE:不引用常量,用于写入 CSV 文件时不引用任何字段
- csv.Error:CSV 模块中的异常基类
- csv.fieldnames:CSV 文件的字段名称列表
- csv.reader.line_num:当前读取的行号
- csv.Dialect.delimiter:字段分隔符的字符
- csv.Dialect.quotechar:引号字符
- csv.Dialect.escapechar:转义字符
- csv.Dialect.doublequote:是否将引号字符双写
- csv.Dialect.skipinitialspace:是否跳过字段前的空格
- csv.Dialect.lineterminator:行终止符的字符
- csv.Dialect.quoting:引用风格的设置
- csv.Dialect.ignore:忽略的字符
- csv.Dialect.strict:是否启用严格模式
四、 writer 对象
- writer.dialect:返回当前使用的CSV方言对象
- writerwriterow(row):将一行数据写入CSV文件。row是一个可迭代对象,表示一行的数据
- writer.writerows(rows):将多行数据写入CSV文件。rows是一个可迭代的对象,每个元素表示一行的数据
import csv
with open('test.csv','w',newline='') as csv_file:
writer= csv.writer(csv_file)
writer.writerow(['id', 'name', 'age'])
writer.writerow(['10001', 'Mike', 20])
writer.writerows([['10002', 'Bob', 22],['10003', 'Jordan', 21]])
五、 DictWriter 对象
- dictWriter.writeheader():写入CSV文件的列名行。该方法将使用fieldnames属性指定的列名,并将其作为CSV文件的第一行
- dictWriter.writerow(rowdict):写入一行数据到CSV文件。rowdict是一个字典,其中键是列名,值是对应的数据。该方法将根据fieldnames属性的顺序将数据写入CSV文件的相应列
- dictWriter.writerows(rowdicts):写入多行数据到CSV文件。rowdicts是一个字典列表,其中每个字典表示一行数据。与writerow()方法类似,该方法将根据fieldnames属性的顺序将数据写入CSV文件的相应列
import csv
with open('test.csv','w',newline='') as csv_file:
fieldnames = ['id', 'name', 'age']
dict_writer= csv.DictWriter(csv_file,fieldnames=fieldnames)
dict_writer.writeheader()
dict_writer.writerow({'id':'10001','name':'Mike','age':20})
dict_writer.writerows([{'id':'10002','name':'Bob','age':22},{'id':'10003','name':'Jordan','age':22}])