Pandas介绍
pandas库,在python中有着非常重要的地位,提供了一系列优秀、简洁的方法!
对pandas最直观的理解就是一个强大的Excel表格,有列、行、索引,可以根据列、行、索引操作数据,可以对数据做筛选、排序、分组、拆分等一系列你想要的操作,可以一行代码,把不同格式的文件进行读取分析,如文本、Excel、Json等!
使用Pandas
如果需要在你的python代码里,使用Pandas,首先要引入对应的库(在此确定你对python已经有一定的语法了解,以下对应代码的截图来自Jupyter中文集成版,Git: GitHub - DaiMaBang/Jupyter: Jupyter中文集成版,是把python3.8和jupyter notebook高度集成,jupyter傻瓜式安装,用最简洁友好的纯中文方式(jupyter汉化100%)展现出来的优秀Jupyter绿色使用工具。本工具,把Jupyter的复杂操作简单化,集成pandas、numpy、matplotlib等常用三方库,并附带一些python的基础语法、pandas使用、股票分析实例,让您能最快的开始Jupyter的编写。https://github.com/DaiMaBang/Jupyter)
numpy提供了pandas的数据结构、数据类型,pandas提供了一系列数据操作的方法
下面就可以创建一个pandas对象了。
pandas常用的两个数据结构,Series和DataFrme,下面的例子,做一个大概的理解
怎么样理解Series
Series个人觉得最通俗的理解,就是一个数组,可以是一维可以是N维,里面可以存放任何的数据类型
上面的代码创建了一个week1..week7的Series对象,index索引,如果不指定的话,默认就是一个从0开始data数组大小长度的索引,index的索引,可以是数字,当然也可以是字母,如果指定索引时,一定要确定,指定的索引长度和data长度要一致,不然会报错
上面的代码,是Series的基本认知