概要
本文主要将了打开文件的函数open()的参数,以及文件对象的函数,还有Pandas的基础知识。
一、文件对象的函数
1.1 open()函数
将某一文本文件打开为txtFile:
txtFile = open(filename, mode, ecoding=None)
filename是文件名,也就是说当文本文件与py文件在同一目录下时如此打开,在不同目录下时文件名应该是文本文件的完整路径。mode是打开模式由两个字母组成,第一个字母是操作模式,第二个是文件打开类型。ecoding是文件的编码形式。文件打开模式字母意义如下:
字母 | 代表含义 |
---|---|
“ r ” | 只读模式(默认) |
“ w ” | 覆写模式(没有这个文件则创建,有则覆盖) |
“ n ” | 追加模式(没有这个文件则创建,有则追加内容) |
“ x ” | 创建写模式(有文件则报错,没有则创建) |
“ t ” | 文本类型 |
“ b ” | 二进制类型 |
1.2 文件对象的函数
函数 | 意义 |
---|---|
open() | 打开文件 |
resd(size) | 以指定字节数读取,没有或为负数则读取全部内容 |
resdline() | 读取整行 |
resdlines() | 读取全部行并返回列表 |
write(s) | 把字符串s写入文件,默认编码是utf-8 windows的默认编码是GBK,用ecoding=“GBK” |
writelines(s) | 向文件写入元素全为字符串的列表,如需换行需自己写入换行符 |
seek(off, whence=0) | 设置文件读写当前位置 |
tel() | 返回文件当前读写位置 |
close() | 关闭文件 |
二、基于Pandas的文件处理
2.1 Pandas读写各种类型文件
2.1.1 Pandas对文件读取的函数
读取函数 | 写入函数 | 文件类型 |
---|---|---|
read_csv | to_csv | 读写CSV文件 |
read_excel | to_excel | 读写Excel文件 |
read_json | to_json | 读写JSON文件 |
2.1.2 Pandas读取文件函数的参数
参数 | 含义 |
---|---|
sep 或 delimiter | 列分割符 |
header | 列名,如果文件中已经有列名则传None |
index_col | 作为索引的列名 |
skiprows | 要跳过的文件头行数 |
na_values | 用于处理缺失数据的字符串 |
encoding | 字符编码方式 |