python pandas 的最基本应用:构建Series, DataFrame

pandas的一些最基本的操作 python 3.7.1

构建series

import pandas as pd
d={'a':1,'b':2,'c':3,'d':4}
dd=[1,2,3,4]
ddd=(1,2,3,4)
index=['a','b','c','d']

构建一个简单的series:

ds=pd.Series(d)
print(ds)

得到的结果为:

a 1
b 2
c 3
d 4
dtype: int64

把index加上:

ds=pd.Series(d,index)
print(ds)

得到与上一步一模一样的结果:

a 1
b 2
c 3
d 4
dtype: int64

我们再试着通过一个列表构建series:

dds=pd.Series(dd)
print(dds)

结果为:

0 1
1 2
2 3
3 4
dtype: int64

然后把index加上去:

dds=pd.Series(dd,index)
print(dds)

结果为:

a 1
b 2
c 3
d 4
dtype: int64

我们再试着通过一个元组构建series:

ddds=pd.Series(ddd,index)
print(ddds)

结果为:

a 1
b 2
c 3
d 4
dtype: int64

无论是字典,列表还是元组,都可以构建series。只不过,dict自带index,而list,tuple要专门定义index(也就是每一行的行名)。系统默认的index为0,1,2,3…

同时,构建出的series可以理解为构建了一个字典。

构建dataframe

尝试构建dataframe。

如果通过字典格式的数据构建:

df=pd.DataFrame({'one':d,'two':d})
#{'one':d,'two':d}{'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':1,'b':2,'c':3,'d':4}}
#就是一个双重的字典
print(df)

输入的结果为:

one two
a 1 1
b 2 2
c 3 3
d 4 4

同时,如果我们通过series构建dataframe:

df=pd.DataFrame({'one':ds,'two':ds})
print(df)

输入的结果一模一样:

one two
a 1 1
b 2 2
c 3 3
d 4 4

所以,series 完全可以当作一个字典来用。
同时可以发现,dataframe可以理解为一个双层的字典

如果通过列表格式的数据构建:

df=pd.DataFrame([d,d])
#[d,d][{'a':1,'b':2,'c':3,'d':4},{'a':1,'b':2,'c':3,'d':4}]
#这是一个列表
print(df)

输出的结果为:

a b c d
0 1 2 3 4
1 1 2 3 4

把index加上:

df=pd.DataFrame([d,d],index=['one','two'])
print(df)

结果为:

a b c d
one 1 2 3 4
two 1 2 3 4

这个可以理解为:我们构建了一个长的series。
通过元组构建也是一样。

所以,dataframe就是一个双重的series。
上面的内容还是挺乱的。所以,推荐先构建series,然后以字典的形式通过series再构建dataframe。记住一种方法就行了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值