#Series的运算
s = pd.Series(np.random.randint(10,100,size=10))
s + 100
s - 100
s / 100
s % 2
s1 = pd.Series(np.random.randint(10,100,size=3))
s2 = pd.Series(np.random.randint(10,100,size=3))
display(s1,s2)
s1 + s2 #对应索引相加
s3 = pd.Series(np.random.randint(10,100,size=4))
s2 + s3 #缺失的维度为NAN
s2.add(s3,fill_value=0) #s2缺失的值用0填充
#DataFrame
d = {
'name':['Python','Pandas','Numpy'],
'age':[30,20,20]
}
df = pd.DataFrame(d)
df
display(df)
df.values #二维数组的数据
df.columns #列索引
df.index #行索引
df.shape #形状
df.head(2)
df.tail(2)
df.index = list('ABC') #设置index为ABC
df.columns = ['name2','age2'] #设置列索引为name2和age2
df = pd.DataFrame(d,index=list('ABC'))
df = pd.DataFrame(
data=np.random.randint(10,100,size=(4,6))
)
df = pd.DataFrame(
data=np.random.randint(10,100,size=(4,6)),
index=['AA','BB','CC','DD'],
columns=['python','java','C','C++','spark','hive']
)
#取列索引
df.python #Series类型
df['python'] #Series类型
df[['python']] #DataFrame类型
df[['python','java']]
#取行索引(DataFrame默认先取列索引)
df.loc['AA'] #Series类型
df.iloc[0] #Series类型
df.loc[['AA','BB']] #DataFrame类型
df.loc[['AA']]
df.iloc[[0,-1]] #取所有数据
#取某个元素,先取列,再取行
df['python']['AA']
df['python'][0]
#先取行,再取列
df.loc['AA']['python']
df.loc['AA'][0]
Python基础之Pandas(二)
最新推荐文章于 2024-10-02 10:53:34 发布