作为数据分析师,在日常生活中我们会接触到各种各样的需求,其中excel更必不可少,面对庞大数据量,快速的需求我们该如何处理,这时Pandas就显得举足轻重,可以快速有效的处理表格数据,实现快速并准确的输出。
1.Pandas的数据结构详细介绍
Pandas中一共有三种数据结构,分别为Series(一维数据结构)、DataFrame(二维表格型数据结构)、Multilndex(三维数据结构)。
我们今天先来详细的了解下Series的内容:
Series是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据(value)和与之相关的索引(index)两部分构成。
1.1 Series的创建
#入 NumPy 并将 pandas 加载到您的命名空间中:
import pandas as pd
import numpy as np
pd.Series(data = None, index = None, dtype = None)
输出:Series([], dtype: float64)
"""
注释:参数:
data:传入的数据,可以是ndarray、list等
index:索引,必须是唯一的,且与数据的长度相等。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。
dtype:数据的类型
"""
请看以下的相关实例:
- 指定