Python数据分析与展示-4-1

最新推荐文章于 2022-06-26 11:31:03 发布

特立独行的Supergirl

最新推荐文章于 2022-06-26 11:31:03 发布

阅读量284

点赞数

分类专栏： python数据分析

本文链接：https://blog.csdn.net/weixin_43182180/article/details/106077268

版权

python数据分析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Pandas库入门

Pasdas库介绍

Pandas数据类型

（一）Seriesl类型：由一组数据及与之相关的数据索引组成

（二）DataFrame类型：由共用相同索引的一组列组成

Pasdas库数据类型操作

Pasdas库数据类型运算

Pasdas库介绍

Pandas是Python第三方库，提供高性能易用数据类型和分析工具,Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用

import pandas as pd

比较Numpy和Pandas:

Numpy	Pandas
基础数据类型	扩展数据类型
关注数据的结构表达	关注数据的应用表达
维度：数据间关系	数据与索引间关系

Pandas数据类型

两种数据类型：一维数据类型：Series
二维/多维数据类型：DataFrame

（一）Seriesl类型：由一组数据及与之相关的数据索引组成

Series类型创建：

Python列表，index与列表元素个数一致
标量值，index表达Series类型的尺寸

Python字典，键值对中的“键”是索引，index从字典中进行选择操作

ndarray，索引和数据都可以通过ndarray类型创建

其他函数，range()函数等

Series类型基本操作：

（1）Series类型包括index和values两部分

（2）Series类型的操作类似ndarray类型

索引方法相同，采用[]
NumPy中运算和操作可用于Series类型
可以通过自定义索引的列表进行切片
可以通过自动索引进行切片，如果存在自定义索引，则一同被切片

（3）Series类型的操作类似Python字典类型

通过自定义索引访问
保留字in操作
使用.get()方法

（4）Series类型对齐操作：Series类型在运算中会自动对齐不同索引的数据

（5） Series类型的name属性：Series对象和索引都可以有一个名字，存储在属性.name中

（6）Series类型的修改：Series对象可以随时修改并即刻生效

（二）DataFrame类型：由共用相同索引的一组列组成

DataFrame是一个表格型的数据类型，每列值类型可以不同
DataFrame既有行索引、也有列索引
DataFrame常用于表达二维数据，但可以表达多维数据
DataFrame类型创建：

二维ndarray对象

由一维ndarray、列表、字典、元组或Series构成的字典
Series类型
其他的DataFrame类型

DataFrame类型的数据操作与Series类似，依据行类索引。

Pasdas库数据类型操作

增加或重排：重新索引
.reindex()能够改变或重排Series和DataFrame索引

.reindex(index=None, columns=None, …)

索引类型常用方法：

删除：.drop()能够删除Series和DataFrame指定行或列索引

Pasdas库数据类型运算

算术运算

算术运算根据行列索引，补齐后运算，运算默认产生浮点数
补齐时缺项填充NaN (空值)
二维和一维、一维和零维间为广播运算
采用+ ‐ * /符号进行的二元运算产生新的对象

比较运算

比较运算只能比较相同索引的元素，不进行补齐
二维和一维、一维和零维间为广播运算
采用> < >= <= == !=等符号进行的二元运算产生布尔对象
同维度运算，尺寸一致；不同维度，广播运算，默认在1轴

特立独行的Supergirl

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析与展示-4-1

Pandas库入门
复制链接

扫一扫

专栏目录