Pandas十分钟快速入门

最新推荐文章于 2024-04-07 10:25:17 发布

leoliyao

最新推荐文章于 2024-04-07 10:25:17 发布

阅读量259

点赞数

文章标签： pandas python 开发语言

本文链接：https://blog.csdn.net/weixin_46626325/article/details/127990895

版权

Series结构也称为Series序列，是Pandas常用的数据结构之一，它是一种类似于一维数组的结构，由一组数据值和一组标签组成，其中标签与数据值具有对应关系
标签不必是唯一的，但必须是可哈希类型的，该对象既支持整数的索引，也支持基于标签的索引，并提供了许多方法来执行涉及索引的操作，ndarray的统计方法已被覆盖，以自动排除缺失的数据（目前表示为NaN）
Series可以保存任何数据类型，比如整数，字符串等等，它的标签默认为整数，从0开始一次递增
创建Series
pd.Series(data=None,index=None,dtype=None,name=None,copy=False)
data——输入的数据，可以是列表，常量，ndarray数组等，如果是字典，则保持参数顺序
index——索引值，必须是可散列的
copy——表示对data进行拷贝，默认为False，仅影响Series和ndarray数据

ar_list = [3,10,3,4,5]
print(type(ar_list))
s1 = pd.Series(ar_list)
print(s1)
print(type(s1))

默认的Rangeindex不能使用负值来表示从后往前查找元素，但是可以使用负值来新增元素比如s1[-1]会报错，但是s1[-1]=20就不会报错就会变成赋值操作，可以新增不同类型索引的数据，新增不同索引类型的数据，索引的类型会自动发生变化
使用字典来作为Series就不会生成默认的索引，就会把字典中的key作为索引，value作为值
在使用Series这个方法进行序列化的时候可以使用index传递一个数组来进行显式的创建索引
Series的切片与Python稍微不同，Series使用标签切片的时候是末端也包含，但是使用位置切片的时候和Python一样是末端不包含的。
特殊情况是当位置索引和标签索引刚好一致，使用切片时，如果是数值会认为是Python切片运算，不包含末端
使用head()方法默认能查看前5条数据，但是通过在head()方法中传递一个数值型的参数可以指定为查看具体的条数，tail()方法类似，tail查看的是最后的数据

当创建了Series序列之后可以使用reindex来重新指定索引，还可以使用fill_value属性来指定原来值为NaN的填充值

使用drop（）方法来删除Series中的元素，调用drop（）方法后会返回删除后的值，原值是默认不改变的，要想要原值发生改变需要使inplace这个属性设置为True，这时候删除的值的位置返回的就是None
添加方法比较简单，直接想好待添加的值和索引，然后直接序列[索引值] = 值即可完成添加功能

DataFrame是Pandas的重要数据结构之一，也是最常用的结构之一
DataFrame是一个表格型的数据结构，既有行标签也有列标签，它也被称为异构数据表。异构指的就是表格中每列的数据类型可以不同，比如可以是字符串，整型，浮点型等等。
DataFrame的每一列数据都可以看成是一个Series结构。与Series一样，DataFrame自带行标签索引，默认为隐式索引，即从0开始依次递增，行标签与DataFrame中的数据项一一对应。
在创建DataFrame的时候可以使用columns这个属性来指明每一列的名称

data = [['xiaoming',20],['Lilly',30],['Anne',40]]
df = pd.DataFrame(data,columns=['Name','Age'])
print(df)

在这里插入图片描述

DataFrame取列直接指明列名即可，要选取多个列可以使用列表的方式指定多个列名，但是注意没办法直接通过标签位置去获取列
使用insert()方法来添加列
可以使用del 或 pop()删除DataFrame中的数据列，pop()有返回值
DataFrame的行操作就不能使用[]这种方法来访问了，行操作需要借助loc()方法来完成，按标签或布尔数组访问一组行或列
使用数据型索引需要使用iloc
添加数据行需要使用append()方法，需要注意在使用的时候如果不指明插入的index也会报错，如果不想指定想让他接着上次的自动递增需要ignore_index这个属性=True
追加列表的时候：
如果list是一维的，则以列的形式追加
在这里插入图片描述