Python数据分析三剑客之Pandas

本文介绍了Python数据分析库Pandas,重点讲解了Series和DataFrame两种核心数据结构。Series是一维数组,包含数据和对应的索引标签;DataFrame是表格型数据结构,支持行列索引和多种数据类型。内容涵盖数据创建、索引、切片和运算等关键操作。
摘要由CSDN通过智能技术生成

Python数据分析三剑客之Pandas

pandas

处理数值型以外的其他类型数据。

常用类:Series,DataFrame

Series

是一种类似于一维数组的对象,有两部分组成:

values:一组数据(ndarray类型)

index:相关的数据索引标签

Series的创建:

  1. 由列表或numpy数组创建
a = Series(data=[1, 2, 3, "Four"])

b = Series(data=np.random.randint(0, 100, size=(3, )))
// 注:用numpy创建时数组必须为一维

a = Series(data=[1, 2, 3, "Four"], index=['a', 'b', 'c', 'd'])
# 用index指定显示索引,默认为0,1,2,3...
# 显示索引可以增强series的可读性
  1. 由字典创建
dic = {
   '语文': 100, '数学': 99, '理综': 250}
c = Series(data=dic)

Series的索引和切片:

# c[0]
c.语文
// 100

c[0:2]
//
语文    100
数学     99
dtype: int64

Series常用属性:

  1. shape
  2. size
  3. index 索引
  4. value 元素值
  5. dtype 元素类型

Series常用方法:

  1. head() 显示前n个数据,tail() 显示后n个数据
  2. unique() 去重
  3. isnull() 用于判断元素是否为空,notnull() 用于判断元素是否为非空
  4. add(),sub(),mul(),div() 索引一致的进行算术运算否则补空
a1 = Series(data=[1, 2, 3], index=['a', 'b', 'c'])
a2 = Series(data=[1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值