pandas 读取文件
文档参考《深入浅出 Pandas 利用Python 进行数据处理与分析》,还有pandas 官方文档,https://www.pypandas.cn/docs/
https://pandas.pydata.org/
https://www.gairuo.com/p/pandas
1 读取的 csv 文件
import numpy as np
import pandas as pd
分类
格式 | 文件格式 | 读取函数 | 写入(输出)函数 | |
---|---|---|---|---|
0 | binary | Excel | read_excel | to_excel |
1 | text | CSV | read_csv read_table | to_csv |
2 | text | JSON | read_json | to_json |
3 | text | 网页表格 HTML | read_html | to_html |
4 | text | 剪贴板 | read_clipboard | to_clipboard |
5 | SQL | SQL | read_sql | to_sql |
6 | XML | read_xml | NaN | read_xml |
7 | text | Markdown | NaN | to_markdown |
读取本地相对路径
df = pd.read_csv('tmp.csv')
df.head()
name | team | Q1 | Q2 | Q3 | Q4 | |
---|---|---|---|---|---|---|
0 | Liver | E | 89 | 21 | 24 | 64 |
1 | Arry | C | 36 | 37 | 37 | 57 |
2 | Ack | A | 57 | 60 | 18 | 84 |
3 | Eorge | C | 93 | 96 | 71 | 78 |
4 | Oah | D | 65 | 49 | 61 | 86 |
读取本地绝对路径
df2 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/tmp.csv')
df2.head()
name | team | Q1 | Q2 | Q3 | Q4 | |
---|---|---|---|---|---|---|
0 | Liver | E | 89 | 21 | 24 | 64 |
1 | Arry | C | 36 | 37 | 37 | 57 |
2 | Ack | A | 57 | 60 | 18 | 84 |
3 | Eorge | C | 93 | 96 | 71 | 78 |
4 | Oah | D | 65 | 49 | 61 | 86 |
读取网络文档
# pd.read_csv('data/my/my.data')
df = pd.read_csv('https://www.gairuo.com/file/data/dataset/GDP-China.csv')
df.head()
年份 | 国民总收入 | 国内生产总值 | 第一产业增加值 | 第二产业增加值 | 第三产业增加值 | 人均国内生产总值 | |
---|---|---|---|---|---|---|---|
0 | 2018 | 896915.6 | 900309.5 | 64734.0 | 366000.9 | 469574.6 | 64644 |
1 | 2017 | 820099.5 | 820754.3 | 62099.5 | 332742.7 | 425912.1 | 59201 |
2 | 2016 | 737074.0 | 740060.8 | 60139.2 | 296547.7 | 383373.9 | 53680 |
3 | 2015 | 683390.5 | 685992.9 | 57774.6 | 282040.3 | 346178.0 | 50028 |
4 | 2014 | 642097.6 | 641280.6 | 55626.3 | 277571.8 | 308082.5 | 47005 |
分隔符
df2 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team3.csv')
df2.head()
name\tteam\tQ1\tQ2\tQ3\tQ4 | |
---|---|
0 | Liver\tE\t89\t21\t24\t64 |
1 | Arry\tC\t36\t37\t37\t57 |
2 | Ack\tA\t57\t60\t18\t84 |
3 | Eorge\tC\t93\t96\t71\t78 |
4 | Oah\tD\t65\t49\t61\t86 |
df3 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team3.csv',sep = '\t')
df3.head()
name | team | Q1 | Q2 | Q3 | Q4 | |
---|---|---|---|---|---|---|
0 | Liver | E | 89 | 21 | 24 | 64 |
1 | Arry | C | 36 | 37 | 37 | 57 |
2 | Ack | A | 57 | 60 | 18 | 84 |
3 | Eorge | C | 93 | 96 | 71 | 78 |
4 | Oah | D | 65 | 49 | 61 | 86 |
表头
df6 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team2.csv')
df6.head()
name | team | Q1 | Q2 | Q3 | Q4 | |
---|---|---|---|---|---|---|
0 | Liver | E | 89 | 21 | 24 | 64 |
1 | Arry | C | 36 | 37 | 37 | 57 |
2 | Ack | A | 57 | 60 | 18 | 84 |
3 | Eorge | C | 93 | 96 | 71 | 78 |
4 | Oah | D | 65 | 49 | 61 | 86 |
df7 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas