pandas基础操作

本文介绍了Pandas的基础操作,包括Series和DataFrame的创建,数据的访问,时间序列处理,简单的数据可视化,以及文件读写。重点讲述了如何按行、列、索引访问数据,时间序列的年月日访问,文件读取与存储,以及与数据库的交互。
摘要由CSDN通过智能技术生成

pandas基础操作

 Pandas是一个强大的时间序列数据处理工具包,最初开发用于分析财经数据,现在广泛的应用于数据分析领域。

对象的创建

pandas的两个基本数据结构分别是Series和DataFrame,其中Series是最基本的数据结构,用来表达一行数据,可以理解为一维的数组。DataFrame是较为关键的数据结构,可以理解为表示的是二维数组。

创建Series对象 pd.Series(array|list)
创建DataFrame对象 df = pd.DataFrame(columns=list)
DataFrame中的数据其实是以Numpy的array对象来保存的

@requires_authorization
s = pd.Series(np.arange(6))
df = pd.DataFrame(np.random.randn(6, 4), columns=list('ABCD'))

对象的访问

原始数据(含数据类型)的访问 df.values
按行访问数据 df.iloc[index]
按列名访问某列的数据 df.column_name
维度信息的查看 df.shape
前n行或后n行数据的访问 df.head(num) df.tail(num
对行索引和列索引的访问 df.index df.columns
关于数据表的简单统计信息的访问 df.describe
按索引范围访问 df[3:5]
按指定列名访问几列数据 df[['A', 'B', 'C']]
按行列访问具体元素 df.loc[3, 'A'] df.iloc[3, 0] df.iloc[2:5, 0:2]
按条件访问 df[df.C > 0]
列添加 df['TAG'] = ['cat', 'dog', 'cat', 'cat', 'cat', 'dog']
按某列分组访问 result = df.groupby('TAG').sum()
这里写图片描述

时间序列

Pandas提供了强大的时间序列处理功能,具体表现为可以创建以时间序列为索引的数据集,并对日期数据进行相关的操作。

@requires_authorization
stockdata = pd.read_csv(
'E:\\Pyworkspace\\NLTK_Essentials\\dow_jones_index\\dow_jones_index.data',
            parse_dates=['date'],
            index_col=['da
  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值