Python--Pandas基础------1

Pandas 是一个基于 Python 编程语言的开源数据分析工具,专注于提供快速、灵活且高效的数据结构和数据操作工具。Pandas 提供了丰富的功能,包括数据清洗、数据转换、数据分组、数据合并等。它能够轻松处理各种数据源的数据导入和导出,如CSV、Excel、数据库等。在数据清洗方面,Pandas 提供了丰富的工具来处理缺失值、重复值以及进行数据格式的转换。数据操作时,Pandas 支持通过标签或位置进行数据的选择、过滤和操作,同时也支持复杂的数据操作,如数据透视表、时间序列处理等。由于 Pandas 基于 NumPy 开发,因此它能够高效地处理大规模数据,提供了优化的算法和数据结构,使得用户可以快速进行数据分析和处理。

Pandas 是一款功能强大、易于学习和使用的数据分析工具,它的出现极大地简化了数据处理和分析的流程,成为数据科学领域不可或缺的重要工具之一。

目录

一、安装pandas:

二、pandas使用

1.Series对象创建:

方法一:从列表或数组创建

方法二:从字典创建

方法三:使用标量值创建

方法四:从 NumPy 数组创建

方法五:通过显式指定索引创建

2.DataFrame对象创建

方法一:从字典创建

方法二:从列表列表或二维数组创建

方法三:从 NumPy 数组创建

方法四:从 Series 创建


一、安装pandas:

在pycharm的终端或命令指示符中输入:

pip install pandas

导入:
 

import pandas as pd

Series对象包装的是numpy中的一维数组,实际上是将一个一维数 组与一个索引名称捆绑在一起了。

DataFrame 是 Pandas 中的一个表格型的数据结构,有行索引也有 列索引。

二、pandas使用

1.Series对象创建:

Series:一维数组,与Numpy中的一维array类似。它是一种类似于 一维数组的对象,是由一组数据(各种 NumPy 数据类型)以及一组与 之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的 Series 对象。用值列表生成 Series 时,Pandas 默认自动生成整数索引 。 

方法一:从列表或数组创建
import pandas as pd

# 从列表创建Series
data = [1, 3, 5, 7, 9]
series1 = pd.Series(data)
print(series1)
# Output:
# 0    1
# 1    3
# 2    5
# 3    7
# 4    9
# dtype: int64

# 自定义索引
index = ['A', 'B', 'C', 'D', 'E']
series2 = pd.Series(data, index=index)
print(series2)
# Output:
# A    1
# B    3
# C    5
# D    7
# E    9
# dtype: int64

方法二:从字典创建

import pandas as pd

# 从字典创建Series,字典的键作为索引
data = {'A': 1, 'B': 3, 'C': 5, 'D': 7, 'E': 9}
series3 = pd.Series(data)
print(series3)
# Output:
# A    1
# B    3
# C    5
# D    7
# E    9
# dtype: int64
方法三:使用标量值创建
import pandas as pd

# 使用标量值创建Series
series4 = pd.Series(5, index=['A', 'B', 'C', 'D'])
print(series4)
# Output:
# A    5
# B    5
# C    5
# D    5
# dtype: int64
方法四:从 NumPy 数组创建
import pandas as pd
import numpy as np

# 从NumPy数组创建Series
data = np.array([10, 20, 30, 40, 50])
series5 = pd.Series(data)
print(series5)
# Output:
# 0    10
# 1    20
# 2    30
# 3    40
# 4    50
# dtype: int64
方法五:通过显式指定索引创建
import pandas as pd

# 通过显式指定索引创建Series
data = [1, 2, 3, 4]
index = ['A', 'B', 'C', 'D']
series6 = pd.Series(data, index=index)
print(series6)
# Output:
# A    1
# B    2
# C    3
# D    4
# dtype: int64

2.DataFrame对象创建

DataFrame 是 Pandas 中的重要数据结构,类似于电子表格或数据库中的二维数据表。它由多行和多列组成,每行每列都有标签,可以容纳不同类型的数据。DataFrame 提供了丰富的数据操作和分析功能,包括数据筛选、转换、合并等,广泛应用于数据处理和分析任务中。

方法一:从字典创建

可以使用字典来创建 DataFrame,其中字典的键通常作为列名,字典的值可以是列表、NumPy 数组或 Series。

import pandas as pd

# 从字典创建DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [25, 30, 35, 40],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
}

df = pd.DataFrame(data)
print(df)
# Output:
#       Name  Age         City
# 0    Alice   25     New York
# 1      Bob   30  Los Angeles
# 2  Charlie   35      Chicago
# 3    David   40      Houston
方法二:从列表列表或二维数组创建

可以使用包含列表或二维数组的列表来创建 DataFrame,需要指定列名(列索引)。

import pandas as pd

# 从列表列表创建DataFrame
data = [
    ['Alice', 25, 'New York'],
    ['Bob', 30, 'Los Angeles'],
    ['Charlie', 35, 'Chicago'],
    ['David', 40, 'Houston']
]

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)
# Output:
#       Name  Age         City
# 0    Alice   25     New York
# 1      Bob   30  Los Angeles
# 2  Charlie   35      Chicago
# 3    David   40      Houston
方法三:从 NumPy 数组创建

可以使用 NumPy 数组来创建 DataFrame,需要指定列名(列索引)。

import pandas as pd
import numpy as np

# 从NumPy数组创建DataFrame
data = np.array([
    ['Alice', 25, 'New York'],
    ['Bob', 30, 'Los Angeles'],
    ['Charlie', 35, 'Chicago'],
    ['David', 40, 'Houston']
])

df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)
# Output:
#       Name Age         City
# 0    Alice  25     New York
# 1      Bob  30  Los Angeles
# 2  Charlie  35      Chicago
# 3    David  40      Houston
方法四:从 Series 创建

可以使用多个 Series 对象来创建 DataFrame,每个 Series 对象将成为 DataFrame 的一列,需要指定列名。

  • 25
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值