Pandas数据加载、存储与文件格式处理学习笔记

最新推荐文章于 2022-08-07 17:37:45 发布

Smilelulinlin

最新推荐文章于 2022-08-07 17:37:45 发布

阅读量347

点赞数

分类专栏： python 文章标签： pandas 学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Smilelulinlin/article/details/115211021

版权

python 专栏收录该内容

15 篇文章 5 订阅

订阅专栏

文章目录

获取文件size,shape,row,cols
将读取的字段转为时间

简介

Pandas的重点就是两个数据结构series 以及DataFrame，pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。输入输出数据通常可以划分为以下几个大类：

读取文本数据如csv,execl,txt等
加载数据库中的数据
利用webAPI操作网络资源

解析API说明

pandas中的解析函数有read_csv,read_table,read_fwf,read_clipboard.

read_csv

read_csv API官方说明

常用的参数说明：

参数	说明
sep	分隔符，比如’\s+‘’\r\t’
header	表头，一般默认为None,header = None
names	定义列名
index_col	指定行索引
skiprows	跳过
na_values	指定空（NAN,NULL)
comment	用于将注释信息从行尾拆分出去的字符
parse_dates	尝试将数据解析为日期，默认为False.
date_parser	用于解析日期的函数
nrows	需要读取的行数
skip_footer	需要忽略的行数

逐块读取文本文件

pd.read_csv('test.csv',sep=',',nrows=5) #指定行数,读取几行
pd.read_csv('test.csv',sep=',',chunksize=1000) #指定行数，分块读取

其他格式的文本数据的读取方式基本上一致。

header = 0 # 以第一行为头
df = pd.read_csv(infile,header=header)

获取文件size,shape,row,cols

len(df) #获取行数
len(df.columns)#获取列数
df.shape # 获取行数*列数 （289，9）

将读取的字段转为时间

date = str(pd.to_datetime(date, format='%Y/%m/%d'))

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas数据加载、存储与文件格式处理学习笔记

文章目录简介解析API说明read_csv逐块读取文本文件简介Pandas的重点就是两个数据结构series 以及DataFrame，pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。输入输出数据通常可以划分为以下几个大类：读取文本数据如csv,execl,txt等加载数据库中的数据利用webAPI操作网络资源解析API说明pandas中的解析函数有read_csv,read_table,read_fwf,read_clipboard.read_csvread_
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。