python的csv的使用
最近在学习spark,发现在csv中的使用非常广泛。
csv简介
csv(Comma Separated Values),即逗号分隔值(也称字符分隔值,因为分隔符可以不是逗号),是一种常用的文本格式,用以存储表格数据,包括数字或者字符。很多程序在处理数据时都会碰到csv这种格式的文件,它的使用比较广泛。
csv模块中的函数
- reader(csvfile,dialect=‘excel’,**fmtparams)
- csvfile,必须是支持迭代(Iterator)的对象,可以是文件(file)对象或者列表(list)对象,如果是文件对象,打开时需要加“b”标志参数
- dialect,编码风格,默认为excel的风格,也就是用逗号(,)分隔
- fmtparam,格式化参数,用来覆盖之前的dialect对象指定的编码风格
import csv
with open(‘test.csv’,’rb’) as myFile:
lines=csv.reader(myFile)
for line in lines:
print line
- writer(csvfile,dialect=‘excel’,**fmtparams)
- 参数同上
import csv
with open(’t.csv’,’wb’) as myFile:
myWriter=csv.writer(myFile)
myWriter.writerow([7],’g’)
myWriter.writerow([8,’h’])
myList=[[1,2,3],[4,5,6]]
myWriter.writerows(myList)