呀~博主是正在学习数据分析的一员,记录的是自己学习过程中总结的知识点,肯定有不完善的地方,如有问题可以私聊我改正,共同学习进步。希望大家都能保持学习的热情,坚持自己,不断超越自己!
博客地址:qxi的博客
#今天就开始总结pandas模块的基础知识啦~#
为了入门pandas,需要熟悉两个常用的工具数据结构,Series
和DataFrame
。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效、易用的基础。
这篇文章先介绍Series,Series是一种一维数组型对象,它包含了一个值序列
(与numpy中的类型相似),并且包含了数据标签,称为索引
(index)。换个角度考虑Series,可以认为它是一个长度固定且有序的字典
,因为它将索引值以及序列值按位置配对。
PS:文中的pd代表模块pandas
①直接用pd.Series()
函数就可以生成Series了,可以看到索引值在左边,序列值在右边,当不知道索引时,默认生成的索引是从0到N-1(N是数据的长度)。可以通过values
属性以及index
属性分别获取Series对象的值和索引。
import pandas as pd
s=pd.Series([12,3,5,-7]) #括号里是一维数组,就是一个序列
print(s)
print(s