pandas -1数据结构

这篇博客主要介绍了pandas的数据结构,包括Series和DataFrame。Series是一维数组,具有名称和索引,可以像字典和向量一样操作。DataFrame则是一个二维表格,包含列名和行索引,常用于数据处理。
摘要由CSDN通过智能技术生成

pandas -1 数据结构

pandas 基本操作都很简单,只是在刚开始学习的过程中,容易忘掉一些API,导致完成一些操作时,总会想着翻翻手册,这一系列博客,是对这些方法进行了梳理,可作为入门学习的参考材料。平时经常翻阅。

“index” (axis=0, default), “columns” (axis=1)

1. Series

Series 是一个带有 名称 和索引的一维数组。

创建seriex

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

// Series 数组生成,指定数据类型
In:
user_age = pd.Series(data=[18, 30, 25, 40], dtype=float)

Out:
0 18
1 30
2 25
3 40
dtype: int64


// 增加索引 index
In:
user_age.index = ["Tom", "Bob", "Mary", "James"]

Out:
Tom 18
Bob 30
Mary 25
James 40
dtype: int64

// 表头
In:
user_age.index.name("name")

Out:
name
Tom 18
Bob 30
Mary 25
James 40
dtype: int64

像字典一样使用series

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
// index 当键值
In:
user_age["Tom"]
user_age.get("Tom")

// 切片-列
In:
user_age[2:3]

// 按条件查找
In:
user_age[user_age > 30]

Out:
name
James 40.0
Name: user_age_info, dtype: float64

像向量一样使用series

可以传递给np方法

1
2
3
4
5
6
7
8
9
10
11
// 整列加减
In:
user_age + 1

Out:
name
Tom 19.0
Bob 31.0
Mary 26.0
James 41.0
Name: user_age_info, dtype: float64

2. DataFrame

DataFrame 是一个带有 名称 和索引的二维数组,像一张Excel表格。

创建DataFrame

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

// DataFrame 根据字典生成

In:
index = pd.Index(data=["Tom", "Bob", "Mary", "James"], name="name")

data = {
"age": [18, 30, 40],
"city": ["BeiJing", "ShangHai", "HangZhou"]
}

user_info = pd.DataFrame(data=data, index=index)
user_info

Out:

// DataFrame 根据二维列表生成
In:
data = [[18, "BeiJing"],
[30, "ShangHai"],
[25, "GuangZhou"],
[40, "ShenZhen"]]
columns = ["age", "city"]

user_info = pd.DataFrame(data=data, index=index, columns=columns)
user_info
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值