#1024程序员节│征文#
1.Pandas库简介
2.Pandas库模块功能
一、Pandas库简介
Pandas是Python的一个开源数据分析库,它提供了高效的数据结构和数据分析工具,是数据分析和处理的强大工具之一。
Pandas的起源与发展:Pandas最初由AQR Capital Management于2008年4月开发,并于2009年底开源。之后,由专注于Python数据包开发的PyData开发团队继续开发和维护,属于PyData项目的一部分。Pandas的名字衍生自术语“panel data”(面板数据)和“Python data analysis”(Python数据分析),体现了其在数据处理和分析方面的强大功能。
官方链接:https://pandas.ac.cn/docs/getting_started/index.html
其他学习网址:https://www.runoob.com/pandas/pandas-intro.html菜鸟教程
二、Pandas库模块功能
1.数据结构
(1)DataFrame:二维表格数据结构,可以看作是由多个Series(一维数组)组成的。它提供了灵活的行和列索引,方便进行复杂的数据操作。
(2)Series:一维数组数据结构,可以存储任何数据类型(整数、字符串、浮点数、Python对象等),并且每个数据点都有一个标签(索引)。
2. 数据读取与写入
(1)读取数据:Pandas提供了多种函数来读取不同格式的数据文件,如CSV、Excel、JSON、SQL数据库等。
pd.read_csv(filepath_or_buffer, ...):读取CSV文件到DataFrame。
df.to_csv(path_or_buf, ...):将DataFrame写入CSV文件。
(2)写入数据:可以将DataFrame或Series对象写入到CSV、Excel、JSON、SQL数据库等文件中。
df.head(n):返回数据集的前n行,默认前5行。
df.t