Pandas数据分析01——Series基本操作

最新推荐文章于 2024-04-27 17:30:34 发布

爱学习的cat

最新推荐文章于 2024-04-27 17:30:34 发布

阅读量639

点赞数 1

文章标签： python 数据分析

本文链接：https://blog.csdn.net/weixin_45713984/article/details/108929938

版权

文章目录

前言
一、pandas是什么？
- 1.基本功能：
- 2.数据结构：
二、Series使用方法
总结

前言

Pandas是python的一个数据分析包，最初由AQR Capital Management于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来，因此，pandas为时间序列分析提供了很好的支持。

以下是本篇文章正文内容，下面案例仅供参考

一、pandas是什么？

pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。
Pandas官网链接

1.基本功能：

数学运算和约简（比如对某个轴求和）可以根据不同的元数据（轴编号）执行
灵活处理缺失数据
合并及其他出现在常见数据库（例如基于SQL的）中的关系型运算

2.数据结构：

Series(一维)
Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。
DataFrame(二维)
DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。
DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共用同一个索引）。
Panel(三维)

二、Series使用方法

1.创建方法

代码如下（示例）：

#Series的创建方法
a = pd.Series([11,22,33,44])
b = pd.Series(range(4))
c = pd.Series(range(4),index = ["a","b","c","d"])
d = {'BeiJing':35000,'ShangHai':42000,'GuangZhou':36000,'ShenZhen':41000}

2.访问数据Series

代码如下（示例）：

print(a[1:3])
print(c.index)
print(c[["a","c"]])
print(d.values())

输出结果：

--------------------------------------------------------
1    22
2    33
dtype: int64
Index(['a', 'b', 'c', 'd'], dtype='object')
a    0
c    2
dtype: int64
dict_values([35000, 42000, 36000, 41000])
--------------------------------------------------------

3.Series的数组间的运算

代码如下（示例）：

#Series的数组间的运算
print(a + b)
print(a * 2)
print(a >= 33)
print(a[a >= 33])

输出结果：

--------------------------------------------------------
0    11
1    23
2    35
3    47
dtype: int64
0    22
1    44
2    66
3    88
dtype: int64
0    False
1    False
2     True
3     True
dtype: bool
2    33
3    44
dtype: int64
--------------------------------------------------------

4.Series数学函数的使用

代码如下（示例）：

#Series数学函数的使用
print(b.mean())
print(b.count())
print(b.sum())
print(b.median())
print(b.var())
print(b.std())

输出结果：

--------------------------------------------------------
1.5
4
6
1.5
1.6666666666666667
1.2909944487358056
--------------------------------------------------------

5.Series数据结构的重新

代码如下（示例）：

#Series数据结构的重新
ser1 = pd.Series(['a','b','c','d','e'],index=[2,1,3,5,4])
ser2 = ser1.reindex([1,2,3,4,5,6],fill_value=0)
ser3 = ser2.reindex(range(10),method='bfill')
print(ser3)

输出结果：

--------------------------------------------------------
0      b
1      b
2      a
3      c
4      e
5      d
6      0
7    NaN
8    NaN
9    NaN
dtype: object
--------------------------------------------------------

总结

本文仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法，还需自行挖掘。

爱学习的cat

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas数据分析01——Series基本操作

文章目录前言一、pandas是什么？1.基本功能：2.数据结构：二、Series使用方法1.创建方法2.访问数据Series输出结果：3.Series的数组间的运算输出结果：4.Series数学函数的使用输出结果：5.Series数据结构的重新输出结果：总结前言Pandas是python的一个数据分析包，最初由AQR Capital Management于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部
复制链接

扫一扫