python批量分析表格_Python数据分析,批量合并表格

51a24b49-990d-49ab-93ba-1ae23d2de289.gif

8367a3c5-c6fa-45f6-bf5d-adceb653dd3b.gif

日常在处理数据时,数据表格常常以固定的格式,这些表格都具有相同的列名,通过对数据表进行整合,可以极大的提高我们的工作效率。

本节使用两种方法对于表格批量处理,一种是常规的菜单式法,另一种是写代码的方法,通过写代码的方式批量合并表格,这样的方法简单高效,合并数据表后,可以进行下一步的数据分析。

一、菜单式法

这种方法适用于小的数据量,数据量大的时候,打开一个EXCEL表格就已经很费时间了,针对小的数据量的合并,比如本文的data文件夹下是9月份一个月的数据,可以新建一个EXCEL表格,点击数据>获取数据>自文件>从文件夹,点击组和,即可对于数据表进行批量合并。

d3327cdb-aea5-428a-92b1-a2d9bac5bdad.png

ceaa93a6-d1ae-4c3e-af81-6cdf9a5bac6e.png

c9e23dba-8e90-4878-ac02-db0cb66f8dfd.png

二、python批量合并表格

另一种方法是写代码的方式,适用于数据量比较大的批量数据,借助Python中的两个标准库pandas和os库,下面先了解一下这两个库的作用。

Pandas

pandas是python的一个数据分析包

pandas是基于NumPy 解决数据分析任务的一种工具

pandas 纳入了大量库和一些标准的数据模型

pandas提供了高效地操作大型数据集所需的工具

Os库

os库提供通用的、基本的操作系统交互功能

os库包含路径操作、进程管理、环境参数等处理函数

下面实际运用代码进行批量处理表格数据。

第一步、导入批量处理数据所需的Python标准库。

# 导入库import pandas as pdimport os

第二步、设置待读取文件夹、待保存的文件夹以及待保存的

表格名。

# 待读取批量csv的文件夹read_path = 'C:\\Users\\shangtianqiang\\Desktop\\data'# 待保存的合并后的csv的文件夹,在路径自己建立一个data_merge文件夹save_path = 'C:\\Users\\shangtianqiang\\Desktop\\data_merge'# 待保存的合并后的表格名csvsave_name = 'hebing.csv'

第三步、借助os库修改当前工作目录。

#修改当前工作目录os.chdir(read_path)

第四步、将该文件夹下的所有文件名存入一个列表。

#将该文件夹下的所有文件名存入一个列表file_list = os.listdir()

第五步、读取第一个CSV文件并包含表头,注意数据的编码方式。

#读取第一个CSV文件并包含表头df = pd.read_csv(read_path +'\\'+ file_list[0],encoding = 'gbk') #编码默认UTF-8,若乱码自行更改为gbk

第六步、将读取的第一个CSV文件写入合并后的文件保存。

#将读取的第一个CSV文件写入合并后的文件保存df.to_csv(save_path+'\\'+ save_name,encoding="utf_8_sig",index=False)

第七步、循环遍历列表中每一个表格的文件名,并且逐个追加到合并后的文件夹内,这里已经导入了第一个表格的数据,所以,这里FileStart=1,而不是FileStart=0。

#循环遍历列表中各个CSV文件名,并追加到合并后的文件

FileStart = 1

FileEnd = len(file_list)

for i in range(FileStart,FileEnd):

df = pd.read_csv(read_path + '\\'+ file_list[i],encoding = 'gbk') # 编码默认UTF-8,若乱码自行更改为gbk

df.to_csv(save_path+'\\'+ save_name,encoding="utf_8_sig",index=False, header=False, mode='a+')

这里逐一演示代码的运行,可以调试完毕后,将代码封装在一起,针对大批量的数据,这个方法既快捷,又高效。

b19071d3-7d8d-4888-944d-ca9b97dc1a83.jpg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值