python 对csv文件的操作十分简单,几行代码即可搞定csv文件,通常分为读操作和写操作。
读取csv文件
读取普通csv,不带字段名称
示例代码:
>>> import csv
>>> with open('test.csv', 'rb') as csvfile:
... spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
... for row in spamreader:
... print ', '.join(row)
Spam, Spam, Spam, Spam, Spam, Baked Beans
Spam, Lovely Spam, Wonderful Spam
- csv的reader接收一个文件描述符(或迭代器),这里不一定是标准的csv文件,也可以读取excel文件。
- delimiter:表示分隔符,默认是以逗号分隔;
- quotechar:表示引用符,例如字段值都是这样的: |abc|,这时候就要设置quotechar为"|"才能正确读取。
- quoting:引用模式,取值有csv.QUOTE_ALL,csv.QUOTE_MINIMAL, QUOTE_NONNUMERIC,QUOTE_NONE,默认是csv.QUOTE_MINIMAL,即引用模式是引用quotechar的值,也可以设置csv.QUOTE_NONE, 不引用字符,所有字符都认为是值,也可以使用csv.QUOTE_NONNUMERIC,这时字段就必须是数字型,结果就会转换成浮点数而不是默认的字符串。
读取带字段名称的csv
实例代码:
>>> import csv
>>> with open('names.csv') as csvfile:
... reader = csv.DictReader(csvfile) # 注意函数是大写
... for row in reader:
... print(row['first_name'], row['last_name'])
...
Baked Beans
Lovely Spam
Wonderful Spam
DictReader接收以下几个参数:
- fieldnames:字段名称,默认是第一行的数据。
- restkey:当实际的字段数量大于上面参数指定的数量时,多出来的字段名称就是这个restkey指定。
- restval: 与上面相反,当实际的字段数量少的时候,多余的字段名称的值就由restval指定。
- 其他基本和reader一致。
写csv文件
写普通csv文件
示例代码:
import csv
with open('eggs.csv', 'wb') as csvfile:
spamwriter = csv.writer(csvfile, delimiter=' ',
quotechar='|', quoting=csv.QUOTE_MINIMAL)
spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])
基本上和reader一致。
写带字段名称的csv文件
实例代码:
import csv
with open('names.csv', 'w') as csvfile:
fieldnames = ['first_name', 'last_name']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
writer.writeheader() # 注意有写header操作
writer.writerow({'first_name': 'Baked', 'last_name': 'Beans'})
writer.writerow({'first_name': 'Lovely', 'last_name': 'Spam'})
writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})
DictWriter有几个参数需要注意:
- ** restval**:多余的字段所取的值;
- ** extrasaction**:当数据中有额外的字段时所采取的操作,默认为’raise’,即抛异常,有时候这种情况比较烦,所以还可以设置成’ignore’直接忽略。