Python - pandas库的使用

最新推荐文章于 2024-06-14 16:41:27 发布

GQ177

最新推荐文章于 2024-06-14 16:41:27 发布

阅读量502

点赞数 1

分类专栏：求学之路 - Python

本文链接：https://blog.csdn.net/seek0226/article/details/108170142

版权

pandas是基于Numpy构建的数据分析库，提供高效的数据结构如Series和DataFrame，适用于复杂的标签化数据处理。本文将详细介绍如何创建和操作Series及DataFrame，包括向量化计算、数据读取、属性获取、内容修改、应用函数、分组和数据透视表，以及缺失值处理。通过实例展示其在数据分析中的强大功能。

摘要由CSDN通过智能技术生成

Python - pandas库的使用

pandas简介

Numpy在向量化的数值计算中优势明显，但是在处理较为复杂的数据，例如标签化的数据中表现力不从心，而基于Numpy库进行开发的Pandas提供了使得数据分析变得更简单的高级数据结构和操作工具。
由于pandas基于Numpy开发，所以pandas的向量化和矩阵运算与numpy基本相同。
但是对于纯粹的计算，Numpy要比pandas更加快速。

调用方法

import pandas as pd

关于pd.Series

Series是带有标签数据的一维数组。

创建series对象

pd.Series(data,index=,dtype)
# data可以是列表，字典或np数组， index是索引，为可选参数，dtype同

通过列表创建

>>> a = pd.Series([1,2,3,4])
>>> a
0    1
1    2
2    3
3    4
dtype: int64
# 数据为标量的时候
>>> a = pd.Series(1,index=['a','b'])
>>> a
a    1
b    1
dtype: int64

通过np数组创建


>>> a = pd.Series(np.arange(4),index=['a','b','c','d'])
>>> a
a    1
b    2
c    3
d    4
dtype: int32
>>> a['a']
1

通过字典创建

>>> dict = {
   'a':1,'b':2,'c':3,'d':4}
>>> pd.Series(dict,index=['a','b','c','d','e'])	# 如果有指定标签，那么会根据index以及字典的key进行比对，比对成功则输出，没有找到输出NaN。
a    1.0
b    2.0
c    3.0
d    4.0
e    NaN
dtype: float64

关于pd.DataFrame

DataFrame是带有标签的多维数组

创建DaraFrame对象

pd.DataFrame(data, index=, columns=)	# columns为列标签，可选参数!

通过Series对象创建

>>> a
a    1
b    2
c    3
d    4
dtype: int64
>>> pd.DataFrame(a, columns = ["num"])
   num
a    1
b    2
c    3
d    4

通过字典对象进行创建

>>> dict
{
   'a': [1, 2, 3], 'b': [4, 5, 6], 'c': 3, 'd':

最低0.47元/天解锁文章

GQ177

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python - pandas库的使用

Python - pandas库的使用pandas简介关于关于关于pandas简介关于关于关于
复制链接

扫一扫

专栏目录