【Python 数据处理】Pandas

weixin_41042487

已于 2022-04-23 23:51:43 修改

阅读量3.3k

点赞数

分类专栏： python 文章标签： python

于 2022-04-20 23:29:47 首次发布

本文链接：https://blog.csdn.net/weixin_41042487/article/details/124309299

版权

Pandas是Python的数据分析库，基于Numpy提供数据结构和操作。本文介绍了如何使用Pandas处理数据，包括Series的一维数据操作，如生成、查看、修改数据和索引，以及DataFrame的二维数据操作，如生成、查看、修改列标签和行标签。

摘要由CSDN通过智能技术生成

Pandas 是 Python 语言的一个扩展程序库，用于数据分析。

Pandas 名字衍生自术语 "panel data"（面板数据）和 "Python data analysis"（Python 数据分析）。

Pandas 一个强大的分析结构化数据的工具集，基础是 Numpy（提供高性能的矩阵运算）。

一、Pandas Series——列，一维数据

二、Pandas DataFrame——数据框，二维数据

1.pd.DataFrame

生成DataFrame

一、Pandas Series——列，一维数据

Series是一种类似于一维数组的对象，它由一组数据data（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）index 组成。

Series 类似Excel表格中的一个列（column），类似于一维数组，可以保存任何数据类型。

1.加载和使用 pandas

import pandas as pd  #一般别名为pd
pd.函数名             #调用pandas函数

2.pd.Series

生成Series

pandas.Series( data, index, dtype, name, copy)
#参数说明：
#函数名Series中，S开头大写

#data：一组数据(ndarray 类型)。

#index：数据索引标签，如果不指定，默认从 0 开始。可自行设置，索引数据可重复，不一定为自然数列
#index数量必须与data数量一致

#dtype：数据（data）的数据类型，默认会自己判断。

#name：设置名称。

#copy：拷贝数据，默认为 False。

方式一：通过函数定义生成列

#方式一：通过函数定义生成列
import pandas as pd
a = ["ni", "hao", "ma"]
my_s = pd.Series(a, index = ["x", "y", "z"])
print(my_s)


#输出结果：
x     ni
y    hao
z     ma
dtype: object

方式二：通过字典生成列

#方式二：通过字典生成列
import pandas as pd
a = {"x":"ni", "y":"hao", "z":"ma"}
my_s = pd.Series(a)
print(my_s)

#输出结果：
x     ni
y    ha

最低0.47元/天解锁文章

weixin_41042487

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录