python pandas 的最基本应用：构建Series, DataFrame

最新推荐文章于 2024-08-23 08:00:00 发布

Chipeyown

最新推荐文章于 2024-08-23 08:00:00 发布

阅读量1.8k

点赞数 1

文章标签： pandas python3

本文链接：https://blog.csdn.net/weixin_43745169/article/details/89240774

版权

pandas的一些最基本的操作 python 3.7.1

import pandas as pd
d={'a':1,'b':2,'c':3,'d':4}
dd=[1,2,3,4]
ddd=(1,2,3,4)
index=['a','b','c','d']

构建一个简单的series:

ds=pd.Series(d)
print(ds)

得到的结果为：

a 1
b 2
c 3
d 4
dtype: int64

把index加上：

ds=pd.Series(d,index)
print(ds)

得到与上一步一模一样的结果：

a 1
b 2
c 3
d 4
dtype: int64

我们再试着通过一个列表构建series：

dds=pd.Series(dd)
print(dds)

结果为：

0 1
1 2
2 3
3 4
dtype: int64

然后把index加上去：

dds=pd.Series(dd,index)
print(dds)

结果为：

a 1
b 2
c 3
d 4
dtype: int64

我们再试着通过一个元组构建series：

ddds=pd.Series(ddd,index)
print(ddds)

结果为：

a 1
b 2
c 3
d 4
dtype: int64

无论是字典，列表还是元组，都可以构建series。只不过，dict自带index，而list，tuple要专门定义index（也就是每一行的行名）。系统默认的index为0,1,2,3…

同时，构建出的series可以理解为构建了一个字典。

尝试构建dataframe。

如果通过字典格式的数据构建：

df=pd.DataFrame({'one':d,'two':d})
#{'one':d,'two':d}即{'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':1,'b':2,'c':3,'d':4}}
#就是一个双重的字典
print(df)

输入的结果为：

one two
a 1 1
b 2 2
c 3 3
d 4 4

同时，如果我们通过series构建dataframe:

df=pd.DataFrame({'one':ds,'two':ds})
print(df)

输入的结果一模一样：

one two
a 1 1
b 2 2
c 3 3
d 4 4

所以，series 完全可以当作一个字典来用。
同时可以发现，dataframe可以理解为一个双层的字典

如果通过列表格式的数据构建：

df=pd.DataFrame([d,d])
#[d,d]即[{'a':1,'b':2,'c':3,'d':4},{'a':1,'b':2,'c':3,'d':4}]
#这是一个列表
print(df)

输出的结果为：

a b c d
0 1 2 3 4
1 1 2 3 4

把index加上:

df=pd.DataFrame([d,d],index=['one','two'])
print(df)

结果为：

a b c d
one 1 2 3 4
two 1 2 3 4

这个可以理解为：我们构建了一个长的series。
通过元组构建也是一样。

所以，dataframe就是一个双重的series。
上面的内容还是挺乱的。所以，推荐先构建series,然后以字典的形式通过series再构建dataframe。记住一种方法就行了。

关注