python数据分析与展示 嵩天_基于MOOC嵩天《Python数据分析与展示》视频学习记录——第三周:Pandas...

1.Pandas库的基本数据类型

1.1.Series类型

Series类型由一组数据及与之相关的数据索引组成。

1.1.1自动索引

20200325095552724.png

1.1.2.自定义索引

20200325095420835.png

注:若index为第二个变量,则可以省略

1.2.创建Serises类型

1.2.1.从标量值创建

20200325095352933.png

注:index不能省略

1.2.2.从字典类型创建

20200325095809288.png

同时可以通过index指定Series的结构并从字典选取对应值:

20200325100107693.png

1.2.3.从ndarray类型创建

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

同时也可以通过index指定索引:

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

1.2.4.总结

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

1.3.Series类型的基本操作

b = pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])

b.index # 获取索引

b.values # 获取数据

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

自动索引与自定义索引并存

并存但不能混用

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

1.4.Series类型的对齐操作

相同索引的数值之间进行运算:

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

1.5.Series类型的name属性

Series对象和索引都可以有一个名字,存储在属性.name中。

Series对象可以随时修改并即刻生效。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

1.6.Series类型的修改

Series对象可以随时修改并即刻生效。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.1.DataFrame类型

DataFrame类型由共用相同索引的一组列组成。

DataFrame是一个表格型的数据类型,每列值类型可以不同。

DataFrame既有行索引、也有列索引。

DataFrame常用于表达二维数据,但可以表达多维数据。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.2.创建DataFrame类型

2.2.1.从ndarray对象创建

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.2.2.从一维ndarray对象字典创建

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.2.3.从列表类型的字典创建

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.3.DataFrame类型的基本操作

d.index # 获得第0列的索引

d.columns # 获得第0行的索引

d.values # 获得数据部分

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

DataFrame基本操作类似于Series,依据行列索引。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.Pandas库的数据类型操作

2.1.重新索引

.reindex( )能够改变或重排Series和DataFrame索引。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

.reindex( )的其他参数:

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.2.索引类型的常用方法

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.3.删除指定索引对象

.drop( )能够删除Series和DataFrame指定行或列索引。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.4.Pandas库的数据类型运算

算术运算法则:

算术运算根据行列索引,补齐后运算,运算默认产生浮点数。

补齐时缺项填充NaN (空值)。

二维和一-维、一维和零维间为广播运算。

采用± * /符号进行的二元运算产生新的对象。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.4.1.方法形式的运算

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

2.4.2.比较运算法则

比较运算只能比较相同索引的元素,不进行补齐。

二维和一-维、一维和零维间为广播运算。

采用><>=<=-- !=等符号进行的二元运算产生布尔对象。

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjUwOTM0,size_16,color_FFFFFF,t_70

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值