pandas对每十行做批量操作_pandas批量处理数据

最新推荐文章于 2021-05-27 08:21:09 发布

weixin_39667080

最新推荐文章于 2021-05-27 08:21:09 发布

阅读量495

点赞数

文章标签： pandas对每十行做批量操作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39667080/article/details/111742115

版权

pandas批量处理数据

1.Excel表的拼接

这里为了方便就采用jupyter进行编辑操作了，不熟悉jupyter的朋友出门左转！

数据的话先放到目录下，当然也可以绝对路径引用，这都是小事，只要你知道自己的数据存放在哪就行！

接下来上干货！首先导入需要用到的pandas库，python的精髓不就是调包嘛！！！

我这里有三个数据表，都是网上找的，侵删！

将三张表中的数据分别导入到三个变量当中，可以输出查看下数据格式！

import pandas as pd

# 导入数据

data1 = pd.read_excel("python导学课数据/用户购买数据/用户购买信息数据1.xlsx")

data2 = pd.read_excel("python导学课数据/用户购买数据/用户购买信息数据2.xlsx")

data3 = pd.read_excel("python导学课数据/用户购买数据/用户购买信息数据3.xlsx")

看一下是不是很漂亮的数据！注意圈出来的部分叫作index，是pandas添加的，后续操作的时候会涉及，这里埋个伏笔！

数据导入后就需要进行合并了，这里用到的就是concat拼接函数！注意使用规范！不行就安排上游标卡尺！

# 数据拼接

data = pd.concat([data1, data2, data3])

合并后的数据这里就不展示了，篇幅有限！需要注意的是，这里是以行进行拼接，所以列数应该保持一致，要不然可拼不上！！！

拼接完成之后就是Excel输出了，用到的操作是啥您老自己看吧！！！

# Excel格式输出

data.to_excel("总表.xlsx", index = None)

需要注意的是，这里涉及到了之前提及的index，这里设置导出不需要index！！！至于目录的话，我这里是当前目录，就直接输出了！这里展示下输出结果，也没啥技术含量!

至此，Excel的导入及表的拼接就完成了！

2.数据的操作

拼接不是目的，数据的操作才是硬道理，所以接下来我们介绍下数据的处理！

数据列的提取，直接上代码！

data["商品价格水平"]

这样就可以将“商品价格水平”这一列数据提取出来了！结果如下

接下来我们看下这一列数据中的数值分布情况，代码如下

data["商品价格水平"].value_counts()

看到了吧，这样的话就得到了"商品价格水平"的不同取值情况！

当然也可以得到数据的其他分布情况，比如均值

data["商品价格水平"].mean()

求最大值

data["商品价格水平"].max()

求最小值

data["商品价格水平"].min()

weixin_39667080

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas对每十行做批量操作_pandas批量处理数据

pandas批量处理数据1.Excel表的拼接这里为了方便就采用jupyter进行编辑操作了，不熟悉jupyter的朋友出门左转！数据的话先放到目录下，当然也可以绝对路径引用，这都是小事，只要你知道自己的数据存放在哪就行！接下来上干货！首先导入需要用到的pandas库，python的精髓不就是调包嘛！！！我这里有三个数据表，都是网上找的，侵删！将三张表中的数据分别导入到三个变量当中，可以输出查看下...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。