用Python处理数据分析,这些电子表格你要知道

在这里插入图片描述
我在大学的时候曾经是Excel的忠实用户。那时我还不知道如何编码,所以至少我需要知道Excel才能找到工作。

每当我想清理数据、创建数据透视表和制作图表时,Excel都会给我很大帮助。也就是说,每当数据有几百万行或进行复杂的计算时,要么Excel变得很慢,要么工作簿崩溃了。

我数不清有多少次这些路障阻止了我的工作流程,也数不清有多少次我不得不一次又一次地重复一项任务。

幸运的是,我学会了用Python编码,我不再有这些问题了。

本文会给大家介绍一些Python中最好用的电子表格,以及为什么你应该选择它而不是excel

一、电子表格:Mito

Mito是Python中的一个电子表格。简单地说,如果你能编辑一个Excel文件,你现在就能写代码。

这意味着我们可以拥有像Excel这样的电子表格的简单性和Python的力量。我们可以像使用Excel一样使用Mito,在我们做完每个动作后,Mito会自动生成与每个动作相对应的Python代码。

要使用Mito,首先,我们需要安装Python和Jupyter Notebook或Jupyter Lab。然后,我们可以通过在终端或命令提示符上运行以下命令来安装Mito。

python -m pip install mitoinstaller
python -m mitoinstaller install

这就是我们开始使用Mito所需要的一切!

如果你在安装过程中有任何问题,请查看官方文档。https://docs.trymito.io/getting-started/installing-mito

现在让我们来做你在Excel中会做的任务,比如阅读文件、创建列、数据透视表、可视化等等。

二、为什么使用它

1、读取文件–Excel可以处理大约100万行,Python可以处理更多行

Excel在你能使用的行数上有一个限制。如果你试图打开一个有数百万行的文件,文件会被打开,但你在Excel中不会看到超过1,048,576行。相比之下,Python 可以处理数以百万计的行。唯一的限制将是你的PC的计算能力。

让我们看看我们如何用Mito读取一个文件。

在读取一个CSV文件之前,首先,我们需要创建一个Mito电子表格。要做到这一点,我们运行下面的代码。

import mitosheet
mitosheet.sheet()

现在是读取CSV文件的时候了。对于这个演示,我将使用一个包含学校分数的数据集,你可以在这里下载。一旦你下载了该文件,点击 "+"或 "导入 "按钮来读取它,如下所示。
在这里插入图片描述
除了导入之外,下面的代码也会自动生成。

import pandas as pd
StudentsPerformance_csv = pd.read_csv(r'StudentsPerformance.csv')

2、用Excel,你可以实现基本的自动化。有了Mito和Python,天空是无限的

在Excel中,你可以创建一个宏来记录一系列的动作,只要你想,就可以执行。

有了Mito,我们可以做同样的事情,如果再加上Python的数百个免费库,你可以做更多的事情,比如通过电子邮件发送报告,使用WhatsApp发送文件,使用Google表单作为基本数据库等等。

让我们用Mito记录一些操作,就像我们使用Excel一样。

a. 创建一个新列/重命名列

如果你想创建一个新的列,只需点击 "Add Col "按钮。默认情况下,"添加列 "按钮将创建一个名为 "new-column "的列,因此我们将通过双击该列名将其重命名为 “average”。

在这里插入图片描述
Mito将生成与我们在电子表格上所做的操作相对应的代码。

b. 对某一行求和

如果你想对某一行进行求和,我们只需要在一个单元格中写出公式(math score+reading score+writing score)/3。比如我们想计算数学、阅读和写作的平均分数。我们只需要在 "平均 "栏内的任何单元格中写下公式(数学分数+阅读分数+写作分数)/3。

在这里插入图片描述
这是Mito生成的代码。

c. 制作一个透视表

创建一个透视表就像点击 "透视 "按钮一样简单。然后我们要选择行、列和值。让我们创建一个透视表,在 "种族/民族 "栏内显示A、B、C、D和E组的数学和阅读分数的平均值。

在这里插入图片描述
为了用Python创建这个数据透视表,我们必须编写下面的代码。使用Mito,上面的代码会自动生成。

d. 创建柱状图

基本的可视化,如饼状图和柱状图,可以用Mito轻松创建。我们只需要点击 "图表 "并选择图表类型。让我们为之前创建的透视表创建一个条形图,在X轴上显示 “种族/民族”,在Y轴上显示 “数学分数平均值”。

在这里插入图片描述
很好! 在a、b、c和d中生成的几行代码相当于一个Excel宏。每次运行代码,我们都会执行所有记录的动作。

03、Python可以处理复杂的计算。这些计算可以使Excel工作簿崩溃

那些会使Excel工作簿崩溃的内存密集型计算,在Python中可以正常工作。在这种情况下,我们要用另一个叫做bamboolib的Python库来执行一系列的动作。

三、电子表格:Bamboolib

要安装bamboolib,在终端上运行命令 pip install --upgrade bamboolib --user。之后,我们要运行下面的命令来读取CSV或Excel文件。

import bamboolib as bam
bam

在这种情况下,我们要在一个有超过100万行的CSV文件中进行一些计算,你可以在这里下载。(https://drive.google.com/file/d/1YiOVav6-g_K8icZMzPszy8K20ozkAMu0/view?usp=sharing)

在这里插入图片描述

像Mito一样,Bamboolib为我们生成了代码(从现在开始,我将只显示步骤,隐藏生成的代码,以保持本文的简短)。

import pandas as pd
df = pd.read_csv(r’/Users/frank/Downloads/sales-data.csv’, sep=,, decimal=., nrows=100000)
df

现在让我们创建一个新的列。要做到这一点,我们在搜索栏上搜索动作,给列起一个名字,并输入列的公式。

对于这个演示,我们将通过使用公式 (revenue/quantity)创建一个 "价格 "列。
在这里插入图片描述
现在让我们在搜索栏中输入 “透视表”。然后我们在行中按产品对数据进行分组,并使用 "sum "作为聚合函数。

在这里插入图片描述

接下来,我们创建一个饼状图。我们必须点击 "创建图表 "按钮,选择图表类型,并选择我们要显示的数值。

在这里插入图片描述

最后,我们从 "日期 "列中提取属性。在这种情况下,我们提取月份的名称,但是,首先,我们必须将 "日期 "列的数据类型改为 date(现在设置为str)。
在这里插入图片描述

如果你遵循了每一个步骤,你可以验证所有的计算都是顺利进行的!

最后

以上就是大家在学习Python需要知道的基础入门知识,还没有掌握的同学要好好理解吸收。当然啦,学习Python仅仅知道这些基础入门知识,还是远远不够的,同学们要想系统全面地学习Python,可以试试下面的python学习资料,非常实用。

如果你对Python感兴趣的话,可以试试我整理的这份Python全套学习资料,微信扫码免费领取

😝朋友们如果有需要的话,可以V扫描下方二维码免费领取🆓

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

#### **一、Python学习路线**

image-20230619144606466

python学习路线图1

二、Python基础学习
1. 开发工具

2. 学习笔记

在这里插入图片描述

3. 学习视频

在这里插入图片描述

三、Python小白必备手册

图片

四、数据分析全套资源

在这里插入图片描述

五、Python面试集锦
1. 面试资料

在这里插入图片描述

在这里插入图片描述

2. 简历模板

在这里插入图片描述

** 因篇幅有限,仅展示部分资料,添加上方即可获取**
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值