pandas 笔记009
目录
九、Pandas文件操作
1.读
import numpy as np
import pandas as pd
1.1 read_csv()
ex1.csv文件打开如下:
a | b | c | d | message |
---|---|---|---|---|
1 | 2 | 3 | 4 | hello |
5 | 6 | 7 | 8 | world |
9 | 10 | 11 | 12 | python |
函数read_csv :从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号
a1 = pd.read_csv('ex1.csv') #ex1.csv文件自带列名(第一行作为列索引值,行索引自动补充)
a1
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 python
1.2 read_table()
函数read_table : 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符("\t")
a2 = pd.read_table('ex1.csv')
a2
a,b,c,d,message
0 1,2,3,4,hello
1 5,6,7,8,world
2 9,10,11,12,python
1.3 sep或delimiter(分隔符)
参数sep或delimiter(分隔符) : 用于对行中各字段进行拆分的字符序列或正则表达式
a3 = pd.read_table('ex1.csv',delimiter=',') # 或sep=','
a3
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 python
1.4 skiprows(忽略跳过行数)
参数skiprows : 需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始算起),默认skiprows=0
a4 = pd.read_csv('ex1.csv',skiprows=1) #skiprows=1,跳过第一行(索引为0),skiprows=2,跳过第一和第二行,以此类推
a4
1 2 3 4 hello
0 5 6 7 8 world
1 9 10 11 12 python
1.5 header(设置列名)
参数header : 用作列名的行号,默认header=0
(第一行为列名),当header=None
时,会自动给出行列索引而不是将原数据的行作为索引值,
ex2.csv如下:
1 | 2 | 3 | 4 | hello |
---|---|---|---|---|
5 | 6 | 7 | 8 | world |
9 | 10 | 11 | 12 | python |