pandas读取文件
pandas可以将读取到的表格型数据(txt,csv)转成DataFrame类型,再对DataFrame操作,进行数据分析。
data = pd.read_csv("data.txt",sep='\t',header=None,names=["a","b","c","d"])
//默认分隔符为逗号,header为None表示为文件加上一行,为列索引,索引的名字即names的值。header为0表示以第0行为索引,如果names存在赋值,则用names的值替换第0行的值
print(data.head())//打印前5行
优点:对行和列的处理较为简单
python读取文件
读文件:
f=open('data.txt','r',encoding='utf-8')//以读文件的模式打开一个文件对象,当读取二进制文件时,r改为rb
f.read()//一次性读取文件的全部内容,读到内存后用一个str对象表示
f.close()//文件对象后占用操作系统的资源,且操作系统同一时间能打开的文件数量是有限的,所以文件使用完毕必须关闭
为了保证无论是否出错都能正确地关闭文件,一开始使用try…finally实现,但是这样写比较繁琐,所以使用with语句来调用close方法,这样就不必调用close方法了
with open('/path/to/file', 'r', encoding='utf-8') as f:
print f.read()//read一次性读取文件,文件太大时会导致内存爆掉,所以可以选用readline()每次只读取一行内容,readlines()一次读取所有内容并返回list
写文件:
f=open('data.txt','w',encoding='utf-8')
f.write('Hello, world!')
f.close()
优化之后:
with open('/Users/michael/test.txt', 'w', encoding='utf-8') as f:
f.write('Hello, world!')