Pandas模块

最新推荐文章于 2023-06-27 10:42:06 发布

「已注销」

最新推荐文章于 2023-06-27 10:42:06 发布

阅读量218

点赞数

本文链接：https://blog.csdn.net/worewolf/article/details/96598288

版权

数据结构简介：DataFrame和Series

pandas中有两类非常重要的数据结构，就是序列Series和数据框DataFrame.Series类似于NumPy中的一维数组，可以使用一维数组的可用函数和方法，而且还可以通过索引标签的方式获取数据，还具有索引的自动对齐功能；DataFrame类似于numpy中的二维数组，同样可以使用numpy数组的函数和方法，还具有一些其它灵活的使用。

#第一种 通过一维数组创建序列
import pandas as pd
import numpy as np

arr1=np.arange(10)
print("数组arr1：",arr1)
print("arr1的数据类型：",type(arr1))
s1=pd.Series(arr1)
print("序列s1:\n",s1)
print("s1的数据类型：",type(s1))

#第二种  通过字典的方式创建序列
dict1={'a':1,'b':2,'c':3,'d':4,'e':5}
print("字典dict1：",dict1)
print("dict1的数据类型：",type(dict1))
s2=pd.Series(dict1)
print("序列s2：",s2)
print("s2的数据类型：",type(s2))

#第三种 通过DataFrame中的某一行或某一列创建序列
#DataFrame的创建依然有三种方法
###第①种 通过二维数组创建数据框
print("第一种方法创建DataFrame")
arr2=np.array(np.arange(12)).reshape(4,3)
print("数组2：",arr2)
print("数组2的类型",type(arr2))

df1=pd.DataFrame(arr2)
print("数据框1：\n",df1)
print("数据框1的类型：",type(df1))
print("------------------------------------------------")
print("\n")

###第②种 通过字典的方式创建数据框
print("第二种方法创建DataFrame")
dict2={'a':[1,2,3,4],'b':[5,6,7,8],'c':[9,10,11,12],'d':[13,14,15,16]}
print("字典2-字典列表：",dict2)
print("字典2的类型",type(dict2))

df2=pd.DataFrame(dict2)
print("数据框2：\n",df2)
print("数据框2的类型：",type(df2))
print("------------------------------------------------")
print("\n")

dict3={'one':{'a':1,'b':2,'c':3,'d':4},
      'two':{'a':5,'b':6,'c':7,'d':8},
      'three':{'a':9,'b':10,'c':11,'d':12}}
print("字典3-嵌套字典：",dict3)
print("字典3的类型",type(dict3))

df3=pd.DataFrame(dict3)
print("数据框3：\n",df3)
print("数据框3的类型：",type(df3))

print("------------------------------------------------")
print("\n")

###第①种 通过数据框创建数据框
print("第三种方法创建DataFrame")

df4=df3[['one','three']]
print("数据框4：\n",df4)
print("数据框4的类型：",type(df4))
print("------------------------------------------------")
print("\n")

print("------------------------------------------------")
print("------------------------------------------------")
print("\n")
#接下来就是通过DataFrame中的某一行或某一列创建序列
s3=df3['one'] #直接拿出数据框3中第一列
print("序列3：\n",s3)
print("序列3的类型：",type(s3))
print("------------------------------------------------")
s4=df3.iloc[0] #df3['a'] #直接拿出数据框3中第一行--iloc
print("序列4：\n",s4)
print("序列4的类型：",type(s4))

2.数据索引index

2.1通过索引值或索引标签获取数据

#通过索引值或者索引标签获取数据
s5=pd.Series(np.array([1,2,3,4,5,6]))
print(s5)#如果不给序列一个指定索引值，序列会自动生成一个从0开始的自增索引

s5.index#通过index属性获取序列的索引值
s5.index=['a','

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas模块

数据结构简介：DataFrame和Seriespandas中有两类非常重要的数据结构，就是序列Series和数据框DataFrame.Series类似于NumPy中的一维数组，可以使用一维数组的可用函数和方法，而且还可以通过索引标签的方式获取数据，还具有索引的自动对齐功能；DataFrame类似于numpy中的二维数组，同样可以使用numpy数组的函数和方法，还具有一些其它灵活的使用。#...
复制链接

扫一扫