一、pandas数据分析
Pandas是一种基于NumPy的开源的数据分析包,提供了高性能、简单易用的数据结构和数据分析函数
1.Series对象
(1)定义和创建
(2)数据访问
(3)常用方法
(1)定义和创建
Series对象是一种带有标签数据的一维数组,标签在Pandas中有对应的数据类型“Index”,Series类似于一维数组字典的结合。
代码展示:
(2)数据访问
代码展示:
(3)常用方法
代码展示:
2.Dataframe对象
(1)定义和创建
(2)数据访问
(3)常用方法
(4)常见操作
(1)定义和创建
DataFrame可以看作是一种既有行索引,又有列索引的二维数组,类似于Excel表或关系型数据库中的二维表,是Pandas中最常用的基本结构。
代码展示:
(2)数据访问
代码展示:
(3)常用方法
详见上一篇
(4)常见操作
L例题:P287-288 12.10
1.使用Pandas读取两个表格数据,并将其根据姓名进行合并;
2.实现按总分或语文、数学、英语单科成绩从高到低排序的功能;
3.打印所有存在不及格科目(单科<60分)的学生记录;
4.获得指定科目的最高分、最低分以及平均分;
5.计算出3班女生语文成绩的平均分;
6.求出各班数学的最高分、最低分以及平均分;
7.根据性别分组,获得男生所有科目的最高分、最低分以及平均分。
代码展示: