pandas 排序 给excel_你好Python!再见Excel?

本文探讨了在数据处理中Excel的局限性和Python的优势。通过对比Excel的操作,如读取、筛选、排序、去重、合并、统计等,展示了Python(特别是pandas库)如何简化这些任务。Python不仅易于入门,还能处理大数据量,运行速度快,适合自动化和维护复杂的分析流程。选择正确的工具对于提高数据分析效率至关重要。
摘要由CSDN通过智能技术生成

现在很多行业,都离不开Excel:

做财务的,要用Excel做报表;

做物流的,会用Excel来跟踪订单情况;

做HR的,会用Excel算工资;

做运营的,会用Excel记录数据做分析。

不知道你有没有这样的经历,每次你用Excel做数据分析时,往往都要生成好多张工作簿,做中间计算的时候,鼠标要一路移到最后一页,才出现最终结果。

如果其中某个数据出了些问题,你可能要从头开始,排查错误,很容易看花眼,错上加错。

976ff0b44a730c13891004dd7e572336.png

为了避免这种情况,很多人开始学Excel的高级技能 - VBA

但其实,VBA并不容易学,而且在数据量大的情况下,VBA运行很耗时。

那么我们应该怎么解决呢?用Python呀!

相比VBA,Python非常容易入门,而且用途广泛。别人用Excel花2天做的事情,Python1ge 小时就能搞定。

下面就用几个常见的操作带你感受一下:

数据读取、生成、存储

Excel读取本地数据需要打开目标文件夹选中该文件并打开

056bf8d32b6793039bfc9c87ae642dc7.gif

Pandas支持读取本地Excel、txt文件,也支持从网页直接读取表格数据,只用一行代码即可,

例如读取上述本地Excel数据可以使用pd.read_excel("示例数据.xlsx")

ceaf834715ab8394b02fe1408e1c5c44.png

以生成10*2的0—1均匀分布随机数矩阵为例,在Excel中需要使用rand()函数生成随机数,并手动拉取指定范围

5f9395d1a436ebaa1103c77b6b642e08.gif

在Pandas中可以结合NumPy生成由指定随机数(均匀分布、正态分布等)生成的矩阵,例如同样生成10*2的0—1均匀分布随机数矩阵为,使用一行代码即可:pd.DataFrame(np.random.rand(10,2))

d0dc7f5686f72e8f4eaa406a59701715.png

在Excel中需要点击保存并设置格式/文件名

a571a5412fdec43da2defd2790b09a2a.gif

在Pandas中可以使用

pd.to_excel("filename.xlsx")来将当前工作表格保存至当前目录下,当然也可以使用to_csv保存为csv等其他格式,也可以使用绝对路径来指定保存位置

d758c5f08ac557c815ae394cd7478755.png

筛选、排序、去重数据

使用我们之前的示例数据,在Excel中筛选出薪资大于5000的数据步骤如下

5240dd7e884178c7487efc9592715f32.gif

在Pandas中,可直接对数据框进行条件筛选,例如同样进行单个条件(薪资大于5000)的筛选可以使用df[df['薪资水平']>5000],如果使用多个条件的筛选只需要使用&(并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值