pandas基础操作

最新推荐文章于 2022-07-13 23:52:37 发布

勤奋的大熊猫

最新推荐文章于 2022-07-13 23:52:37 发布

阅读量184

点赞数 3

分类专栏： pandas 及 Python 数据处理文章标签： python pycharm 爬虫 pandas excel

本文链接：https://blog.csdn.net/u011699626/article/details/120575901

版权

pandas 及 Python 数据处理专栏收录该内容

16 篇文章 0 订阅

订阅专栏

本文介绍了Pandas在Excel数据处理中的基本操作，包括创建一维和二维带标签数组，通过标签或索引获取单个数据值，以及如何提取DataFrame的子集合、单行和单列。示例详细展示了iloc和iat方法用于二维数组数据提取，以及loc方法用于获取单行数据。此外，还展示了如何选取DataFrame的特定行和列。

摘要由CSDN通过智能技术生成

说到excel表格中的数据处理，就不得不提到pandas模块。这里简单分享一下pandas模块的基础操作。这里表格文件的数据类型以xlsx和csv来举例。

举例1：创建一维带标签的数组

df = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])
print(df)
"""
reuslt:
a    3
b   -5
c    7
d    4
dtype: int64
"""

可以看到一维的数据是以列的形式进行排列的

举例2：创建二维带标签的数组

data = {"Country": ["Belgium", "india", "Brazil"], "Capital": ["Brussels", "New Delhi", "Brasilia"], "Population": [
     "11190846", "1303171035", "207847528"]}
df = pd.DataFrame(data, columns=["Country", "Capital", "Population"])
print(df)
"""
reuslt:
   Country    Capital  Population
0  Belgium   Brussels    11190846
1    india  New Delhi  1303171035
2   Brazil   Brasilia   207847528
"""

可以看到这里我们创建了一个二维数据，其中列标签沿着横向排列。索引值沿着纵向排列。

举例3：对于一维数组获取单个数据值

# 通过标签获得单个值
df = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])
print(df['a'])
"""
reuslt:
3
"""
# 通过索引获得单个值
print(df[0])
"""
reuslt:
3
"""

我们通过标签或者索引均成功地获得了单个数据值

举例4：对于二维数组获得单个数据

data = {'Country': ['Belgium', 'india', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasilia'], 'Population': [
    '11190846', '1303171035', '207847528']}
df = pd.DataFrame(data, columns=['Country', 'Capital', 'Population'])
print(df.iloc[0, 0])
print(df.iat[0, 0])
"""
result:
Belgium
Belgium
"""

可以看到，通过DataFrame.iloc()和DataFrame.iat()方法我们均成功地获取到了二维数组中的单个数据值。

举例5：获取DataFrame子集合的值

data = {'Country': ['Belgium', 'india', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasilia'], 'Population': [
    '11190846', '1303171035', '207847528']}
df = pd.DataFrame(data, columns=['Country', 'Capital', 'Population'])
print(df[1:])
"""
result:
  Country    Capital  Population
1   india  New Delhi  1303171035
2  Brazil   Brasilia   207847528
"""

可以看到，我们成功获取到了索引值大于1的原始DataFrame中的所有值。

举例5：通过标签获得单行的值

data = {'Country': ['Belgium', 'india', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasilia'], 'Population': [
    '11190846', '1303171035', '207847528']}
df = pd.DataFrame(data, columns=['Country', 'Capital', 'Population'])
print(df.loc[[0]])
"""
result:
   Country   Capital Population
0  Belgium  Brussels   11190846
"""

可以看到，我们成功获取到了单行的值。

举例6：通过标签获得单列的值

data = {'Country': ['Belgium', 'india', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasilia'], 'Population': [
    '11190846', '1303171035', '207847528']}
df = pd.DataFrame(data, columns=['Country', 'Capital', 'Population'])
print(df[['Country']])
"""
result:
   Country
0  Belgium
1    india
2   Brazil
"""