Python基础之Pandas(二)

#Series的运算
s = pd.Series(np.random.randint(10,100,size=10))
s + 100
s - 100
s / 100
s % 2
s1 = pd.Series(np.random.randint(10,100,size=3))
s2 = pd.Series(np.random.randint(10,100,size=3))
display(s1,s2)
s1 + s2                            #对应索引相加
s3 = pd.Series(np.random.randint(10,100,size=4))
s2 + s3                            #缺失的维度为NAN
s2.add(s3,fill_value=0)            #s2缺失的值用0填充


#DataFrame
d = {
    'name':['Python','Pandas','Numpy'],
    'age':[30,20,20]
}
df = pd.DataFrame(d)
df
display(df)
df.values                          #二维数组的数据
df.columns                         #列索引
df.index                           #行索引
df.shape                           #形状
df.head(2)
df.tail(2)
df.index = list('ABC')             #设置index为ABC
df.columns = ['name2','age2']      #设置列索引为name2和age2
df = pd.DataFrame(d,index=list('ABC'))
df = pd.DataFrame(
    data=np.random.randint(10,100,size=(4,6))
)
df = pd.DataFrame(
    data=np.random.randint(10,100,size=(4,6)),
    index=['AA','BB','CC','DD'],
    columns=['python','java','C','C++','spark','hive']
)

#取列索引
df.python                          #Series类型
df['python']                       #Series类型
df[['python']]                     #DataFrame类型
df[['python','java']]              

#取行索引(DataFrame默认先取列索引)
df.loc['AA']                       #Series类型
df.iloc[0]                         #Series类型
df.loc[['AA','BB']]                #DataFrame类型
df.loc[['AA']]
df.iloc[[0,-1]]                    #取所有数据

#取某个元素,先取列,再取行
df['python']['AA']
df['python'][0]
#先取行,再取列
df.loc['AA']['python']
df.loc['AA'][0]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值