pandas 读取文件

最新推荐文章于 2024-05-18 23:25:36 发布

颗颗豌豆向太阳

最新推荐文章于 2024-05-18 23:25:36 发布

阅读量1.4k

点赞数 1

分类专栏： python 文章标签： pandas python 开发语言

本文链接：https://blog.csdn.net/weixin_43323871/article/details/129348001

版权

文档参考《深入浅出 Pandas 利用Python 进行数据处理与分析》，还有pandas 官方文档，https://www.pypandas.cn/docs/
https://pandas.pydata.org/
https://www.gairuo.com/p/pandas

import numpy as np
import pandas as pd

分类

	格式	文件格式	读取函数	写入（输出）函数
0	binary	Excel	read_excel	to_excel
1	text	CSV	read_csv read_table	to_csv
2	text	JSON	read_json	to_json
3	text	网页表格 HTML	read_html	to_html
4	text	剪贴板	read_clipboard	to_clipboard
5	SQL	SQL	read_sql	to_sql
6	XML	read_xml	NaN	read_xml
7	text	Markdown	NaN	to_markdown

读取本地相对路径

df = pd.read_csv('tmp.csv')
df.head()

读取本地绝对路径

df2 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/tmp.csv')
df2.head()

读取网络文档

# pd.read_csv('data/my/my.data')

df = pd.read_csv('https://www.gairuo.com/file/data/dataset/GDP-China.csv')
df.head()

	年份	国民总收入	国内生产总值	第一产业增加值	第二产业增加值	第三产业增加值	人均国内生产总值
0	2018	896915.6	900309.5	64734.0	366000.9	469574.6	64644
1	2017	820099.5	820754.3	62099.5	332742.7	425912.1	59201
2	2016	737074.0	740060.8	60139.2	296547.7	383373.9	53680
3	2015	683390.5	685992.9	57774.6	282040.3	346178.0	50028
4	2014	642097.6	641280.6	55626.3	277571.8	308082.5	47005

分隔符

df2 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team3.csv')
df2.head()

df3 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team3.csv',sep = '\t')
df3.head()

表头

df6 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas/team2.csv')
df6.head()

df7 = pd.read_csv('/Users/xinmin/DataAnalysis/1.深入浅出Pandas

关注

专栏目录