【Python数据挖掘】实用模块之Pandas

本文介绍了Pandas模块在数据挖掘中的重要性,特别是其高级数据结构——序列(Series)和数据框(DataFrame)。数据框作为虚拟数据库,允许快速按索引访问数据。系列则是一维结果的集合,常用于时间序列分析。文章还探讨了数据框的创建、列的获取以及基础数据处理方法,包括向量化操作和列的增删查改。
摘要由CSDN通过智能技术生成

Pandas模块是一个强大的数据分析和处理模块,能为复杂情形下的数据提供坚实的基础分析功能。

所谓的复杂情形,可能有以下三种:

①数据库表或Excel表,包含了多列不同数据类型的数据(如数字、文字)

②时间序列类型的数据,包括有序和无序的情形,甚至是频率不固定的情形

③任意的矩阵型、二维表、观测统计数据,允许独立的行或列带有标签


下面介绍Pandas模块中的基本的高级数据结构,以及Pandas模块中经典的数据分析和处理方法


一。pandas中的高级数据结构

  • 序列(Series)
  • 数据框(DataFrame)

有了它们,可以利用pandas在计算机内存中构建一个虚拟的数据库。


1. 数据框

  age cash id
0 18 10.53 Jack
1 35 500.70 Sarah
2 20 13.60
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值