pandas 是python的数据分析库,提供快速、灵活和富有表现力的数据结构,用于数据挖掘和数据分析,同时也提供数据清洗功能,与numpy、matplotlib并称,成为数据分析必学的三个库。Pandas的主要功能如下。
此外,其更广泛的目标是成为任何语言中可用的最强大,最灵活的开源数据分析工具。其中最常用的数据结构是DataFrame,本文将详细介绍DataFrame的用法。
Dataframe简介Dataframe是pandas中的数据结构,也是带标签的、大小可变的,二维异构表格。
它类似于电子表格,可以在列中存储不同类型的数据(包括字符,整数,浮点值,分类数据等),Dataframe中的数据以一个或多个二维块存放,不是列表、字典或一维数组结构。
一、创建
1、通过字典创建由数组/list组成的字典创建Dataframe,columns为字典key,index为默认数字标签,字典的值的长度必须保持一致!
2、通过二维数组直接创建通过二维数组直接创建Dataframe,得到一样形状的结果数据,如果不指定index和columns,两者均返回默认数字格式
index和colunms指定长度与原数组保持一致
3、通过字典组成的列表创建由字典组成的列表创建Dataframe,可以允许长度不一致