Pandas常用函数操作示例

本文详细介绍了如何使用Pandas创建Series和DataFrame,包括通过list、dict、DataFrame等方法,以及如何指定索引。同时,文章还涵盖了DataFrame的属性及查询数据的方法,如loc、iloc和query,是Python数据分析的良好参考手册。
摘要由CSDN通过智能技术生成

一、概述

本文主要记录一些常用的pandas 操作示例, 可收藏用作日常编码中的速查手册。

用到的示例可以在下面的索引分类中找到。

二、目录

三、示例

注:以下示例部分参考《利用python进行数据分析》一书

1. pandas 创建 Series

Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。

Series的字符串表现形式为:索引在左边,值在右边。

通过 list 创建 series

通过 list 创建 series不指定索引时候,索引自动生成

 from pandas import Series
 list_data = [4, 7, -5, 3]
 series_data = Series(list_data )

在这里插入图片描述

通过 dict 创建 Series

此种情况下,字典的key为series的索引值

from pandas import Series
dict_data = {
   'Ohio': 35000,  'Oregon': 16000, 'Utah': 5000}
series_data = Series(dict_data )

image-20210708153959775

通过 DataFrame 获取 Series

通过DataFrame 获取某一行、某一列,等到的返回结果是series

from pandas import Series,DataFrame
data = {
   'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = DataFrame(data)
series_data = frame['state']

image-20210708154012775

创建 series 时候指定索引

通过index指定索引, 生成出来的索引带顺序

from pandas import Series
dict_data = [35000,16000,5000]
series_data = Series(dict_data , index = [ 'Ohio','Oregon','Utah' ])

image-20210708154023936

2. pandas 创建 DataFrame


DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。
DataFrame既有行索引(index)也有列索引(columns)

通过字典创建 DataFrame

key会变成列索引,key里边的值成为列里边的数据,行索引没有指定的话会由pandas自动生成

from pandas import DataFrame
data = {
   'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
        'year': [2000, 2001
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值