大家好,关于Python数据分析的工具我们已经讲了很多了,相信一直关注的读者对于Pandas、NumPy、Matplotlib的各种操作一定不陌生,今天我们就用一份简单的数据来学习如何使用Python进行数据分析,本文主要涉及下面三个部分:Pandas数据处理
Matplotlib绘图
彩蛋:利用pyinstaller将py文件打包为exe
虽然本文使用的数据(医学相关)不会出现在你平时的工作学习中,但是处理的过程比如导入数据、缺失值处理、数据去重、计算、汇总、可视化、导出等操作却是重要的,甚至还教你如何将程序打包之后对于重复的工作可以一键完成!因此我十分建议从文末获取数据边敲边思考,毕竟像这样配有详细注释的代码讲解并不多~
数据与需求说明
今天分享的案例来源于一个著名的实验Cell Counting Kit-8。首先我们来看下原始数据:
我们需要完成的工作主要有四块:
1.去除各组所有重复中的最大值和最小值
2. 所有数据根据D0的对应分组进行标准化
3. 计算各组数据的均值和标准差表格:均值汇总表和均值-标准差汇总表
4. 绘制折线图所以我们需要的结果应该是:在自己的桌面上建一个文件夹命名data,将原始数据data.xlsx放进去,之后运行完程序后文件夹会新增3个文件:
而这三个文件就是我们需要的结果
均值汇总表
均值-标准差汇总表
折线图
现在我们就来讲解如何实现。
代码实现
首先导入库并调用函数获取桌面文件夹路径并写在全局
import pandas as