大家好,本文将围绕python如何处理数据量很大的excel文件展开说明,用python处理大量的excel表格是一个很多人都想弄明白的事情,想搞清楚python处理excel数据的优点需要先了解以下几个事情。
打开几M的Excel文件,电脑卡的真是要吐血······
网上说现在的各行业都要Python,即提高了工作效率,又能装B
。也因此,网上也出现了一堆一堆的Python培训python自动化运维库。但是,平时经常用Excel的你会问?到底Python有啥用, 能帮助我提高哪些效率。来,今天我们举个例子告诉你!
首先。我们要处理的Excel文件包含近100万行和16列:
Python提供了read excel()来读取Excel文件作为DataFrame:import pandas as pd
import numpy as np
df = pd.read_excel(...\Excel-Tutorial.xlsx')
这一步很简单,没毛病!
正如你所看到的,到目前为止,数据看起来是OK的,但我们的列标题是错误的。接下来,让定义一个标题行:df = pd.read_excel('…\Excel-Tutorial.xlsx', header=[1]).reset_index()
参数header=[1]指定使用Excel中的第二行作为标题。
数据OK了,下面要做一些分析啦。这时,你可能会用到Pandas库。
加入你是做市场营销的,你希望知道公司每年在不同国家的销售额是多少。
一行代码搞定,用了86毫秒。操作越复杂,速度优势越明显!
如过让你用Excel,你会做多久?
另一个需求可能是销售部门需要按年份和类别求出每个国家的数据。那么,我们须将计算结果保存在不同的工作表中:
下一步,我们将数据再次保存为E