Python数据分析模块----Pandas模块

本文介绍了Python数据分析库Pandas,详细讲解了如何创建和操作Series与DataFrame,包括查看版本信息、创建数据类型、基本操作、运算、数据读取、groupby功能以及实际案例分析,展示了Pandas在处理和分析数据时的强大功能。
摘要由CSDN通过智能技术生成

pandas是什么?

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

优点

  1. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。

  2. pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

  3. 是使Python成为强大而高效的数据分析环境的重要因素之一。

查看pandas版本信息
print(pd.__version__)

在这里插入图片描述

pandas中常见的数据类型

常见的数据类型:
    - 一维: Series
    - 二维: DataFrame
    - 三维: Panel  ....
    - 四维: Panel4D  .....
    - N维: PanelND  ....

创建Series数据类型

1). 通过列表创建Series对象
import pandas as pd
import numpy as np
import  string

array = ["Me", "You", "He"]
# 如果不指定索引, 默认从0开始;
s1=pd.Series(data=array)
print('列表创建Series对象,不指定索引\n',s1)
#指定索引,index设置索引值
ss1=pd.Series(data=array,index=['A','B','C'])
print('列表创建Series对象,指定索引\n',ss1)

在这里插入图片描述

通过numpy的对象Ndarray创建Series;
import pandas as pd
import numpy as np
import  string

# 随机创建一个ndarray对象;
#元素为小数类型,即float类型
data=np.random.randn(5)
s2=pd.Series(data=data)
print('numpy的对象创建Series\n',s2)

# 修改元素的数据类型;
ss2=s2.astype(np.int)
print('修改元素的数据类型为int型\n',ss2)

在这里插入图片描述

3). 通过字典创建Series对象;
import pandas as pd
import numpy as np
import  string

dict = {string.ascii_lowercase[i]:i for i in range(5)}
s3 = pd.Series(dict)
print('字典创建Series对象\n',s3)

在这里插入图片描述

Series基本操作

1). 修改Series索引
import pandas as pd
import numpy as np
import string

array = ["Me", "You", "He"]
s1=pd.Series(data=array)
print('原数据\n',s1)
#可以索引的范围
print('索引的范围',s1.index)
#修改索引值
s1.index = ['A', 'B', 'C']
print('修改后的数据\n',s1)

在这里插入图片描述

2). Series纵向拼接;
import pandas as pd
import numpy as np
import string

array = ["Me", "You", "He"]
s1=pd.Series(data=array)
print('原数据\n',s1)
#再生成一个Series对象
s2=pd.Series(data=array)
#将s2追加到s1中
s3=s1.append(s2)
print('追加后的数据\n',s3)

在这里插入图片描述

3). 删除指定索引对应的元素;
import pandas as pd
import numpy as np
import string

array = ["Me", "You", "He"]
s1=pd.Series(data=array)
print('原数据\n',s1)

# 删除索引为1对应的值;
s1 = s1.drop(1)
print('删除后的数据\n',s1)

在这里插入图片描述

4). 根据指定的索引查找元素
import pandas as pd
import numpy as np
import string

array = ["Me", "You", "He"]
s1=pd.Series(data=array,index = ['A', 'B', 'C'])

print('原数据\n',s1)

print('指定索引为B的对应元素值',s1['B'])
#指定索引为B的元素值为缺失值
s1['B']=np.nan
print('指定索引为B的元素值为缺失值\n',s1)

在这里插入图片描述

5). 切片操作
import pandas as pd
import numpy as np
import string

array = ["Me", "You", "He
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值