一、文件的读取和写入
1.文件读取
(1) 读取路径
输入文件路径时可以采用绝对路径和相对路径两种方式
1.绝对路径
绝对路径是计算机硬盘上的位置,需要输入完整的文件路径
windows默认的文件路径是以 \ 进入下一级
D:\pythonProject\python-learning\dataweo.xls
而pandas是以 / 进入下一级
D:/pythonProject/python-learning/dataweo.xls
示例:
df = pd.read_table('D:/BaiduNetdiskDownload/data_202109.tsv')
2.相对路径
相对路径要求文件与程序在同一文件目录下,输入时可以直接输入文件名
示例:
df = pd.read_table('data_202109.tsv')
注:data_202109.tsv需和程序在同一文件目录下
(2) 文件读取类型
1.读取csv文件
df = pd.read_csv(‘my_csv.csv’)
默认读取以逗号为分隔符的数据。
2.读取txt,xls , tsv文件
df = pd.read_table(‘my_table.txt’)
默认读取以空格或者制表符为分隔符的数据。
注:tsv文件是以制表符为分隔符
3.读取xlsx文件
df = pd.read_excel(‘my_excel.xlsx’)
参数(共用)
header=None
第一行是否作为列名index_col='col1'
设置索引-单列index_col=['col1','col2']
设置索引-多列usecols = [‘col1’]
读取列的集合parse_dates
转换为时间的列nrows=2
读取的行数,此处为2行sep ='\t'
分割参数,可以选择分割符号类型,至此所有读取都可以互相转换。‘||||’为||||,’\t‘为制表符
2.文件写入
1.写为csv文件
df_csv.to_csv(‘my_csv.csv’,index = False)
2.写为txt文件
df = pd.read_table(‘my_table.txt’)
3.读取xlsx文件
df = pd.read_excel(‘my_excel.xlsx’)
参数(共用)
index = False
是否保留索引sep
用途和上面一样header = False
是否保留列索引
3.特性
df = df[‘col1’]
单括号,格式为Series
df = df[[‘col1’,’col2’]]
双括号,格式为DataFrame