Series是一个类似于一维数组的对象,能同时存储不同类型的数据
from pandas import Series
s=Series(data=[1,2,3,'da'],index=['a','b','c','d'])
print(s)
可以用字典直接传数据,常用属性shape,size,index,values
from pandas import Series
dict={"chinese":99,"math":80,"enghlish":100}
s=Series(data=dict)
print(s)
print(s[0])
print(s.math)
print(s[0:2])
print(s.size)
print(s.shape)
print(s.index)
print(s.values)
s.dtype表示数据的类型,数据类型 o表示Object(字符串类型)
from pandas import Series
dict={"chinese":99,"math":80,"enghlish":100}
s=Series(data=dict)
b=Series(data=[1,2,'134'])
print(s.dtype)
print(b.dtype)
Series的常用方法
head(n):显示前n个数据,默认不写是5
tail(n):显示后n个数据
unique():去重
isnull():用于判断每一个元素是否为空,如果为空返回True,否则返回False
notnull():用于判断每一个元素是否不为空,如果不为空返回True,否则返回False
Series算术运算法则:索引一致的元素进行算数运算,否则补空
DataFrame是一个表格型的数据结构,属于多维数据,既有行索引,也有列索引
from pandas import DataFrame
df=DataFrame(data=[[1,3,4,4],[1,23,3]])
print(df)
from pandas import DataFrame
dict={
"name":["zhang","lin","wu"],
"salary":[22,33,99]
}
df=DataFrame(data=dict)
print(df)
from pandas import DataFrame
dict={
"name":["zhang","lin","wu"],
"salary":[22,33,99]
}
df=DataFrame(data=dict,index=["a",'b','c'])
print(df)
DataFrame常用属性:
values:数据
columns:列索引
index:行索引
shape形状
DataFrame可以对行对列进行索引操作和切片操作
from pandas import DataFrame
import numpy as np
df=DataFrame(data=np.random.randint(20,100,size=(8,5)),columns=["a","b","c","d","e"])
print(df)
print(df["a"])#取单列,如果df有显示索引,通过索引机制取行或者列的时候只可以使用显示索引,不能使用默认索引01234……
print(df[["a","c"]])#取多列
print(df.iloc[0])#取单行
print(df.iloc[[0.2.3.6]])#取多行
iloc:通过隐式索引取行
loc:通过显示索引取行
from pandas import DataFrame
import numpy as np
df=DataFrame(data=np.random.randint(20,100,size=(8,5)),columns=["a","b","c","d","e"])
print(df)
print(df.iloc[0])#取单行
print(df.iloc[[0.2.3.6]])#取多行
df.iloc([[1,3,5],2])#表示取第1,3,5行第2列的数据
#切行
df[0:2]#前两行
#切列
df.iloc([:,0:2])前两列
DataFrame算术运算法则:索引一致的元素进行算数运算,否则补空
from pandas import DataFrame
# import numpy as np
import pandas as pd
dict={
"time":['2022-2-3','2022-3-5','2022-7-8'],
"temp":[33,66,88]
}
df=DataFrame(data=dict)
print(df)
print(pd.to_datetime(df['time']))#将time列的数据类型转换成时间序列类型
from pandas import DataFrame
# import numpy as np
import pandas as pd
dict={
"time":['2022-2-3','2022-3-5','2022-7-8'],
"temp":[33,66,88]
}
df=DataFrame(data=dict)
print(df)
# print(pd.to_datetime(df['time']))
df.set_index("time",inplace=True)#将time列作为数据的行索引,如果设置了inplace=True会修改源数据
print(df)