Python·pandas_matplotlib(科学分析和数据可视化)

注:我使用的编写运行软件是Jupyter Notebook (anaconda3)

目录

一、检测配置环境:检测所要使用的第三方库是否安装(未安装需先安装)

一、pandas数据分析

1.Series对象

(1)定义和创建

(2)数据访问 

(3)常用方法 

2.DataFrame对象

(1)定义和创建

(2)数据访问 

(3)常用方法

(4)常见操作

例题:(注:例题来源为个人课内书本例题,无附带材料链接,可作学习讨论参考) 


一、检测配置环境:检测所要使用的第三方库是否安装(未安装需先安装)

一、pandas数据分析

        Pandas 是一种基于MunPy的开源的威数据分析工具包,提供了高性能、简单易用的数据结构和数据分析函数。

1.Series对象

(1)定义和创建
(2)数据访问
(3)常用方法

(1)定义和创建

        Series对象是一种带有标签数据的一维数组,标签在Pandas中有对应的数据类型“Index”,Series类似于一维数组与字典的结合。

(2)数据访问 

(3)常用方法 

2.DataFrame对象

(1)定义和创建
(2)数据访问
(3)常用方法
(4)常见操作

(1)定义和创建

        DataFrane可以看作是一种既有行索引,又有列索引的二维数组,类似于Excel表或关系型数据库中的二维表,是Pandas中最常用的基本结构。

(2)数据访问 

(3)常用方法

(4)常见操作

(1)Pandas中的缺失值处理
(2)Pandas中的分组操作
(3)Pandas中的数据合并操作

例题:(注:例题来源为个人课内书本例题,无附带材料链接,可作学习讨论参考) 

P287_288_12.10:已知两个Excel表格:学生信息表exer_1.xlsx、期末考试成绩表exer_2.xsx分别用于存放学生的基本信息(包括姓名、性别、班级)和学生的期末成绩(包括姓名、语文、数学、英语、总分),如下图所示,完成以下操作。

1.使用Pandas读取两个表格数据,并将其根据姓名进行合并;
⒉实现按总分或语文、数学、英语单科从高到低排序功能;
3.打印所有存在不及格科目(单科<60分)的学生记录;
4.获取指定科目的最高分、最低分以及平均分;
5计算出3班女生语文成绩的平均分;
6.求出各班级数学的最高分、最低分以及平均分;
7.根据性别分组,获取男生所有科目的最高分、最低分以及平均分;

(首选.导入库

import numpy as np
import pandas as pd
1.使用Pandas读取两个表格数据,并将其根据姓名进行合并
data_1 = pd.read_excel('../Stu_pack/pandas/exer_1.xlsx',skiprows =1)   #读取文件数据
print(data_1)
data_2 = pd.read_excel('../Stu_pack/pandas/exer_2.xlsx',skiprows =1)
data_2
data_3 = pd.merge(data_1,data_2)   #根据相同的列表合并数据
#data_3 = data_1.join(data_2.set_index('姓名'),on = '姓名')  #用join()方法合并
data_3
⒉实现按总分或语文、数学、英语单科从高到低排序功能
def sort(df,col):
    ss = df.sort_values(by = col,ascending = False)
    return ss

col = input('请输入您要排序的列名:')
sort(data_3,col)  #调用函数

 3.打印所有存在不及格科目(单科<60分)的学生记录

data_3[(data_3['语文']<60)|(data_3['数学']<60)|(data_3['英语']<60)]   #对列表索引

data_3[(data_3.语文<60)|(data_3.数学<60)|(data_3.英语<60)]   #对属性索引
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我了解了。对于你的问题,我可以给你一个简单的数据分析与可视化案例,使用PythonPandasMatplotlib库。 首先,我们需要准备一个数据集。这里我选用了一个名为“tips”的数据集,它记录了一家餐厅的不同顾客在用餐时的消费金额、小费、性别、是否吸烟、用餐时间等信息。你可以在Seaborn库中找到这个数据集。 接下来,我们可以使用Pandas库将数据集导入到Python中,并进行一些简单的数据处理。例如,我们可以计算不同性别的平均小费金额: ```python import pandas as pd # 导入数据集 tips = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv") # 计算不同性别的平均小费金额 tips.groupby("sex")["tip"].mean() ``` 结果如下: ``` sex Female 2.833448 Male 3.089618 Name: tip, dtype: float64 ``` 接下来,我们可以使用Matplotlib库将这些数据可视化。例如,我们可以绘制不同性别的平均小费金额柱状图: ```python import matplotlib.pyplot as plt # 绘制不同性别的平均小费金额柱状图 tips.groupby("sex")["tip"].mean().plot(kind="bar") # 设置图形标题和坐标轴标签 plt.title("Average Tip by Gender") plt.xlabel("Gender") plt.ylabel("Tip") # 显示图形 plt.show() ``` 结果如下: ![Average Tip by Gender](https://i.imgur.com/5XjVwUH.png) 这只是一个简单的数据分析与可视化案例,你可以根据自己的需求和数据集进行更复杂的数据分析和可视化

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值