经常遇到Python读取excel和csv还有其他各种文件的内容。json还有web端的读取还是比较简单,但是excel和csv的读写是很麻烦。这里记录了
pandas
库提供的方法来实现文本内容和DataFrame
的转化。
一、读取文本格式数据
首先来看一下针对不同格式的文件的读取函数:
总结一下常见参数:(例子见下面代码)
参数 | 作用 |
---|---|
sep | 指定分隔符,可以是正则表达式 |
header | 设置为None时处理没有header的文件 |
names | 指定列 |
index_col | 将列做成索引,可传入列表,可体现层次 |
skiprows | 跳过注释行 |
na_values | 接收表示缺失值的列表或字典 |
import pandas as pd
import numpy as np
import sys
import pymysql
df = pd.read_csv('ex1.csv')
print(df)
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
df = pd.read_table('ex1.csv',sep=',') #可以使用read_table,但必须指定分隔符
# sep还可以是正则表达式
print(df)
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
df = pd.read_csv('ex2.csv',header = None)#不是每一个csv都有header
print(df)
0 1 2 3 4
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
df = pd.read_csv('ex2.csv',names=[