Pandas的数据结构介绍--------Series

要使用pandas,我们必须先了解它的两个主要的数据结构:Series,DataFrame

  • Series
    它是一种类似于一维数组的对象,由一组数据(各种Numpy数据类型)以及一种与之相关的数据标签(即索引)组成。仅仅由一种数据就可以产生最简单的Series:
In [3]: obj = Series([1,4,5,3])

In [4]: obj
Out[4]: 
0    1
1    4
2    5
3    3
dtype: int64

Series的字符串表现形式为:索引在左边,其值在右边。因为没有对数据指定索引值,所以会自动创建一个0~N-1(N为数据的长度)的整数型索引。
我们可以通过Series的values和index属性获取其数组表示形式和索引对象:

In [5]: obj.values
Out[5]: array([1, 4, 5, 3])
In [7]: obj.index
Out[7]: RangeIndex(start=0, stop=4, step=1)

创建一个可以对各个数据点进行标记的索引的Series:

In [8]: obj2 = Series([1,3,5,3],index=['a','d','g','r'])

In [9]: obj2
Out[9]: 
a    1
d    3
g    5
r    3
dtype: int64
In [12]: obj2.index
Out[12]: Index(['a', 'd', 'g', 'r'], dtype='object')

我们还可以将Series看成是一个定长的有序字典,因为它是一个从索引值到数据值的映射。它可以用在许多原本需要字典参数的函数中:

In [13]: 'a' in obj2
Out[13]: True

In [14]: 'b' in obj2
Out[14]: False

如果数据被存放在一个Python字典中,也可以直接通过该字典来创建Series:

In [15]: dict1 = {'iphone':100,'xiaomi':200,'huawei':400}

In [16]: obj3 = Series(dict1)

In [17]: obj3
Out[17]: 
iphone    100
xiaomi    200
huawei    400
dtype: int64

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

In [18]: states = ['xiaomi','apple','huawei','vivo']

In [19]: obj4 = Series(dict1,index=states)

In [20]: obj4
Out[20]: 
xiaomi    200.0
apple       NaN
huawei    400.0
vivo        NaN
dtype: float64

在上面这个例子中,dict1中跟states索引相匹配的那两个值会被找出来并放到相应的位置上。但是由于‘apple’和‘vivo’所对应的dict1值找不到,所以其结果久违NaN(即非数字,在pandas中,它用于表示缺失或者NA值)。在pandas中,可以用isnull和notnull函数检测缺失数据:

In [21]: pd.isnull(obj4)
Out[21]: 
xiaomi    False
apple      True
huawei    False
vivo       True
dtype: bool
In [22]: pd.notnull(obj4)
Out[22]: 
xiaomi     True
apple     False
huawei     True
vivo      False
dtype: bool

Series也有类似的实例方法:

In [24]: obj4.isnull()
Out[24]: 
xiaomi    False
apple      True
huawei    False
vivo       True
dtype: bool

对于许多应用来说,Series最重要的一个功能就是:它在算术运算中会自动对齐不同索引的数据:

In [25]: obj3
Out[25]: 
iphone    100
xiaomi    200
huawei    400
dtype: int64

In [26]: obj4
Out[26]: 
xiaomi    200.0
apple       NaN
huawei    400.0
vivo        NaN
dtype: float64

In [27]: obj3+obj4
Out[27]: 
apple       NaN
huawei    800.0
iphone      NaN
vivo        NaN
xiaomi    400.0
dtype: float64

Series对象本身及其索引都有一个name属性,该属性跟pandas其他的关键功能关系非常密切:

In [29]: obj4.index.name = 'Type'

In [30]: obj4.name = 'number'

In [31]: obj4
Out[31]: 
Type
xiaomi    200.0
apple       NaN
huawei    400.0
vivo        NaN
Name: number, dtype: float64

Series的索引可以通过赋值的方式被就地修改

In [32]: obj.index = [' bob','alice','coco','anan']

In [33]: obj
Out[33]: 
 bob     1
alice    4
coco     5
anan     3
dtype: int64
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: pandas-official-tut-zh epub是指Pandas官方教程的中文电子书格式。Pandas是一个强大的数据分析和处理库,被广泛应用于数据科学和数据分析领域。Pandas官方教程提供了详细的指导和示例,帮助用户学习和使用Pandas库。 这本Pandas官方教程的中文电子书以epub格式提供,这意味着我们可以在支持epub格式的电子书阅读器或软件中阅读它。epub格式是一种开放的电子书标准,可以自由地在各种平台上阅读,如电脑、平板电脑、智能手机等。使用epub格式的好处是,它可以根据设备的屏幕尺寸和用户的设置自动调整页面布局和字体大小,提供更好的阅读体验。 这本教程的目标是帮助读者从零开始学习Pandas,并逐步深入了解其功能和用法。它提供了丰富的示例代码和实践演练,以帮助读者掌握Pandas的各种技术和技巧。教程涵盖了Pandas的基本数据结构,如Series和DataFrame,以及它们的索引、切片、过滤、排序等操作。此外,还介绍Pandas的数据清洗、处理缺失值、数据合并、分组聚合等高级技术。 这本教程的中文版本使更多母语为中文的读者能够更轻松地学习和理解Pandas的概念和功能。epub格式的电子书具有良好的可读性和易于导航的特点,读者可以根据自己的需求和节奏进行学习,随时随地获取所需的知识。 总之,pandas-official-tut-zh epub是一本Pandas官方教程的中文电子书,提供了全面且易于理解的Pandas学习资源,可帮助读者入门并熟练使用该库。无论是初学者还是有经验的数据科学家,都可以从中受益,并将其应用于实际的数据分析项目中。 ### 回答2: pandas-official-tut-zh epub是一本关于pandas库的官方指南的电子书。Pandas是一个强大的数据分析工具,它使用Python编程语言开发。这本电子书提供了从基础概念到高级用法的全面介绍,将帮助读者掌握该库的各种功能和技巧。 该电子书以易于理解和直观的方式解释了pandas库的核心概念,如数据结构、索引和选择、数据聚合和生成等。读者可以通过电子书学习如何使用pandas来处理、清洗和分析各种类型的数据,包括结构化数据、时间序列数据和文本数据。 电子书的内容结构清晰,各章节之间有明确的连贯性,使读者可以系统地学习和理解pandas库的功能和用法。除了基本的数据操作,该电子书还介绍了一些高级特性,如数据合并、重塑和透视等,以及与其他Python工具库的集成。 pandas-official-tut-zh epub不仅提供了理论知识,还包含了丰富的实例代码和可运行的示例,读者可以通过这些实例更深入地理解和运用pandas库。此外,该电子书还提供了一些实际的案例研究,展示了pandas在真实世界中的应用。 总之,pandas-official-tut-zh epub是一本非常有价值的电子书,适合对数据处理和分析感兴趣的读者。无论是初学者还是有一定经验的开发者,都可以从该电子书中获得关于pandas库的全面指导和实用技巧。 ### 回答3: pandas-official-tut-zh epub是一个关于Python数据分析库Pandas的中文官方教程的电子书文件。Pandas是一个强大的数据处理和分析工具,可用于处理和操作大型数据集。 首先,这本电子书是官方教程,意味着内容是由Pandas的开发团队编写的,可以保证信息的准确性和可靠性。它提供了详细的指导和示例,帮助读者了解Pandas的基本功能和高级技术。 这本教程以epub格式提供,这意味着它可以在各种电子设备上进行阅读,如电脑、平板电脑和智能手机。由于epub格式具有自适应屏幕大小和排版的优势,因此读者可以在任何设备上获得良好的阅读体验。 该教程分为多个章节,从介绍Pandas的基本概念和数据结构开始,逐步深入讲解Pandas的应用和高级功能。它涵盖了数据清洗、转换、聚合、合并等方面的常见任务,以及时间序列和数据可视化等更高级的主题。 读者可以通过学习这本教程来掌握Pandas的核心概念和操作技巧,从而更有效地进行数据分析和处理。这对于数据科学家、数据分析师和Python开发者来说都是非常有价值的资源。 总而言之,pandas-official-tut-zh epub是一本官方编写的关于Python数据分析库Pandas的中文教程电子书,为读者提供了全面而系统的学习资源,帮助他们掌握Pandas的各种功能和技术。无论是初学者还是有经验的用户都可以从中受益,并且它的epub格式使得阅读更加方便和灵活。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值