Pandas总结与思维导图

Pandas是一个基于Numpy的数据分析工具,其核心数据结构包括Series和DataFrame。Series是一维数组,而DataFrame是二维表格型数据结构,两者都支持丰富的数据操作功能,如重新索引、丢弃项、算术运算、函数应用、排序和统计计算。Pandas还提供了分类数据处理和处理重复标签的轴索引的方法。
摘要由CSDN通过智能技术生成

Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
利器之一:Series
它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。
利器之一:DataFrame
DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
以下都是根据利用python进行数据分析一书做的总结

数据结构

Series

DataFrame

在这里插入图片描述

基本功能

重新索引

在这里插入图片描述

丢弃指定轴上的项

在这里插入图片描述

索引、选取和过滤

在这里插入图片描述

算术运算和数据对齐

在这里插入图片描述

在算术方法中填充值

在这里插入图片描述

DataFrame和Series之间的运算

在这里插入图片描述

函数应用和映射

在这里插入图片描述

排序和排名

在这里插入图片描述

带有重复标签的轴索引

在这里插入图片描述

汇总和计算描述统计

在这里插入图片描述

分类数据

pandas-分类类型
在这里插入图片描述
pandas的cut,qcut函数的使用和区别
在这里插入图片描述
参考
pandas入门
十分钟入门 Pandas
pandas documentation

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值