利用Python进行数据分析(第五章)

本文介绍了Pandas的基础知识,包括Pandas的Series和DataFrame数据结构,以及它们的基本操作,如描述性统计、数据选择、删除、算术运算等。通过实例展示了如何使用Pandas进行数据处理和分析。
摘要由CSDN通过智能技术生成

Pandas入门

Pandas用来处理表格型或异质型数据,Numpy处理同质型数值类数组

数据结构:Series和DataFrame

Series:

  • 一维的数组型对象,包含值序列和索引(默认0~N-1,也可指定pd.Series([], index=[]))
  • 也可认为是一组长度固定且有序的字典(pd.Series(字典))
  • 相比Numpy数组,可用索引选择数据
  • 检查缺失数据:pd.isnull() 和pd.notnull()
  • 特性:自动对齐索引
  • Series对象自身和索引都有name属性
  • 索引可通过按照位置赋值的方式进行改变

DataFrame:

  • 矩阵的数据表,包含已排序的列集合,既有行索引又有列索引,也可看做共享相同索引的Series字典,是二维的
  • 创建:pd/DataFrame({})
  • 取头五行:df.head()
  • 删除列:del
  • DataFrame取得是数据的视图,不是拷贝。如需赋值,请使用.copy()
  • 转置:df.T
  • 显示数据:df.values 当列是不同dtype时,df.values显示dtype为object
  • 显示索引:df.index,索引对象不可变
  • 显示列名:df.columns

基本功能

重建

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值