【Python】pandas库

Pandas是Python的数据分析库,包含Series和DataFrame两种数据类型。Series是一维带标签数组,可以由列表、标量值或字典创建。DataFrame是二维数据结构,有行索引和列索引,可由二维数组、字典或Series创建。它们支持丰富的索引、运算和数据分析操作,如append、diff、drop、sort_index、sum、mean等。
摘要由CSDN通过智能技术生成

简介

Pandas 是 Python 语言的一个扩展程序库,提供高性能医用数据类型和分析工具。Pandas 主要有 Series 和 DataFrame 两个数据类型,并基于这两个数据类型进行基本操作、运算操作、特征类操作、关联类操作等

Numpy Pandas
基础数据类型 扩展数据类型
关注数据的结构表达 关注数据的应用表达
数据间的关系 数据与索引间的关系

Series

定义

Series 类型是由一组数据及与之相关的数据索引组成,或者说是一维带“标签”数组

import pandas as pd
pd.Series([9, 8, 7, 6])
# 0 9
# 1 8
# 2 7
# 3 6

pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])
# a 9
# b 8
# c 7
# d 6

创建

  • Python 列表:index 要与列表元素个数一致
  • 标量值:index 表示 Series 类型的尺寸,此时不能够省略 index 参数
  • Python 字典:键值对中的键是索引
  • ndarray:索引和数据都可以通过 ndarray 类型创建
  • 其他函数:如 range() 函数等
import numpy as np
import pandas as pd

pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])
# a 9
# b 8
# c 7
# d 6

pd.Series(25, index=['a', 'b', 'c', 'd'])
# a 25
# b 25
# c 25
# d 25

pd.Series({
   'a':9, 'b':8, 'c':7})
# a 9
# b 8
# c 7
pd.Series({
   'a':9, 'b':8, 'c':7}, index=['c', 'a', 'b'. 'd'])
# c 7
# a 9
# b 8
# d NaN

pd.Series(np.arange(5))
# 0 0
# 1 1
# 2 2
# 3 3
# 4 4
pd.Series(np.arange(5), index=np.arange(9,4,-1))
# 9 0
# 8 1
# 7 2
# 6 3
# 5 4

操作

Series 类型对象和索引有 name 属性

import pandas as pd
b = pd.Series
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值