python第三方库03:pandas

提示:以下是本篇文章正文内容,下面案例可供参考

一、pandas是什么?

Pandas是面向数据分析场景设计的Python开源软件工具包,其名字来自英文词组panel data,作为经济界的术语指多维结构化的数据集。从命名来看,Pandas特别适合处理序列数据、表格数据等具有良好结构的数据。在软件使用上,由于Pandsa是基于BSD开源软件许可证发布的,能够很方便地在学习、办公和工业应用等场合使用。
1.提供了简单易用的数据结构和数据分析工具
2.理解数据类型与索引的关系,操作索引即操作数据。

二、使用步骤

Pandas提供了两个数据结构:
Series=索引+一维数据
DataFrame=行列索引+二维数据

1.引入库

代码如下(示例):

from pandas import Series,DataFrame
import pandas as pd

2.两种数据结构

series:一维数组,类似于Python中的基本数据结构list,区别是Series只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。就像数据库中的列数据;
DataFrame: 二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器;
**Panel:**三维的数组,可以理解为DataFrame的容器。(一般用不到)

2.1Series

代码如下(示例):

#说起来还是比较抽象的,下面举几个例子
import pandas as pd
a=[1,2,3]
#将列表a变成Series数据结构
n1=pd.Series(a)
print(a)
print(a[1])

在这里插入图片描述
观察结果,发现,其实series跟列表很像,可以理解为图表中的某列。
在这里插入图片描述
那有聪明的同学就问了,那你这不是脱裤子放屁吗,把一个列表换成跟列表差不多的series图什么?
下面我们接着看一个例子:

import pandas as pd
a = ["Google", "Runoob", "Wiki"]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)

在这里插入图片描述
这下子可以理解我在前面所说的吧:series由索引和列组成,其实就是可以理解为数据的某一列。

2.2DataFrame

下面要介绍的就是Dateframe,其是一个表格型的数据结构,可以把他认为是一个series组成的字典,由下图所示,dataframe每一列都可以认为是一个series(共用一个索引),需要注意的是,dataframe既有行索引,也有列索引。
在这里插入图片描述
dataframe构造方法如下:
在这里插入图片描述
在这里插入图片描述

import pandas as pd
#data为一个列表
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'],dtype=float)
print(df)

在这里插入图片描述

import pandas as pd
#上图的等价形式,此时data是一个字典
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
#不难发现,使用字典时,列名为键key
df = pd.DataFrame(data)
print (df)

总结

以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值