pandas Series和DataFrame的详细使用说明

Series是一个类似于一维数组的对象,能同时存储不同类型的数据

from  pandas import Series
s=Series(data=[1,2,3,'da'],index=['a','b','c','d'])
print(s)

可以用字典直接传数据,常用属性shape,size,index,values

from  pandas import Series
dict={"chinese":99,"math":80,"enghlish":100}
s=Series(data=dict)
print(s)
print(s[0])
print(s.math)
print(s[0:2])
print(s.size)
print(s.shape)
print(s.index)
print(s.values)

 

 s.dtype表示数据的类型,数据类型 o表示Object(字符串类型)

from  pandas import Series
dict={"chinese":99,"math":80,"enghlish":100}
s=Series(data=dict)
b=Series(data=[1,2,'134'])
print(s.dtype)
print(b.dtype)

Series的常用方法

head(n):显示前n个数据,默认不写是5

tail(n):显示后n个数据

unique():去重

isnull():用于判断每一个元素是否为空,如果为空返回True,否则返回False

notnull():用于判断每一个元素是否不为空,如果不为空返回True,否则返回False

Series算术运算法则:索引一致的元素进行算数运算,否则补空

 DataFrame是一个表格型的数据结构,属于多维数据,既有行索引,也有列索引

from  pandas import DataFrame
df=DataFrame(data=[[1,3,4,4],[1,23,3]])
print(df)

 

from  pandas import DataFrame
dict={
    "name":["zhang","lin","wu"],
    "salary":[22,33,99]
}
df=DataFrame(data=dict)
print(df)

 

from  pandas import DataFrame
dict={
    "name":["zhang","lin","wu"],
    "salary":[22,33,99]
}
df=DataFrame(data=dict,index=["a",'b','c'])
print(df)

 DataFrame常用属性:

values:数据

columns:列索引

index:行索引

shape形状

DataFrame可以对行对列进行索引操作和切片操作 

from  pandas import DataFrame
import numpy as np
df=DataFrame(data=np.random.randint(20,100,size=(8,5)),columns=["a","b","c","d","e"])
print(df)

print(df["a"])#取单列,如果df有显示索引,通过索引机制取行或者列的时候只可以使用显示索引,不能使用默认索引01234……
print(df[["a","c"]])#取多列
print(df.iloc[0])#取单行
print(df.iloc[[0.2.3.6]])#取多行

 

 

 

iloc:通过隐式索引取行

loc:通过显示索引取行

from  pandas import DataFrame
import numpy as np
df=DataFrame(data=np.random.randint(20,100,size=(8,5)),columns=["a","b","c","d","e"])
print(df)


print(df.iloc[0])#取单行
print(df.iloc[[0.2.3.6]])#取多行

df.iloc([[1,3,5],2])#表示取第1,3,5行第2列的数据

#切行

df[0:2]#前两行

#切列

df.iloc([:,0:2])前两列

DataFrame算术运算法则:索引一致的元素进行算数运算,否则补空

from  pandas import DataFrame
# import numpy as np
import  pandas as pd
dict={
    "time":['2022-2-3','2022-3-5','2022-7-8'],
    "temp":[33,66,88]
}
df=DataFrame(data=dict)
print(df)
print(pd.to_datetime(df['time']))#将time列的数据类型转换成时间序列类型


 

 

from  pandas import DataFrame
# import numpy as np
import  pandas as pd
dict={
    "time":['2022-2-3','2022-3-5','2022-7-8'],
    "temp":[33,66,88]
}
df=DataFrame(data=dict)
print(df)
# print(pd.to_datetime(df['time']))
df.set_index("time",inplace=True)#将time列作为数据的行索引,如果设置了inplace=True会修改源数据
print(df)

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值