利用python对Excel中的特定数据提取并写入新表

本文介绍使用Python和正则表达式从Excel中提取日期与邮件地址的方法,并统计特定时间段内个人项目时间,最终创建数据透视表。
摘要由CSDN通过智能技术生成
   最近刚开始学python,正好实习工作中遇到对excel中的数据进行处理的问题,就想到利用python来解决,也恰好练手。
   实际的问题是要从excel表中提取日期、邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思)。首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成。
   要用的库一个是对excel读写处理的,一个事正则表达式的库。因为xlwt和xlrd只能对03版以前的excel处理,所以我选择了openpyxl。以下代码就是自己敲的,写了对日期和邮件地址的提取,最后出来效果不错,仅供大家参考,欢迎交流与改进。

import openpyxl
import re

def Exceldivide(file_dir):
 wb=openpyxl.load_workbook(file_dir)         #打开原有的excel表
 sheet=wb.get_sheet_by_name('Sheet1')
 tuple(she
### 回答1: 可以使用Python的openpyxl模块来对Excel中的特定数据进行提取写入格。具体操作包括打开目标Excel文件、找到特定数据所在的单元格、将数据提取出来保存到一个变量中、创建一个格或者打开一个已有的格、将提取出的数据写入格的指定位置。 ### 回答2: Excel是办公软件中常用的电子格软件,它可以帮助我们高效地进行数据录入、处理和分析,而Python是一种高效、易于学习和使用的编程语言。结合PythonExcel的优势,可以方便地对Excel中的数据进行提取和处理。 下面将介绍利用PythonExcel中的特定数据进行提取写入的方法: 1. 安装PythonPython提供了许多强大的库,其中操作Excel格的常用库是openpyxl,可以使用pip install openpyxl命令来安装该库。 2. 加载Excel格 可以使用openpyxl库中的load_workbook()函数来加载Excel格,该函数需要指定Excel格的文件路径,代码示例如下: ``` import openpyxl # 加载Excel格 workbook = openpyxl.load_workbook(filename="example.xlsx") ``` 3. 定位工作Excel中,每个工作都有一个唯一的名称,可以使用workbook对象的worksheet属性来定位工作,代码示例如下: ``` # 定位工作 worksheet = workbook["Sheet1"] ``` 其中,“Sheet1”是工作的名称,可以根据实际的需求进行修改。 4. 提取特定数据 可以使用cell()函数来提取单元格中的数据,该函数需要指定单元格的行和列,代码示例如下: ``` # 提取单元格中的数据 cell_value = worksheet.cell(row=2, column=3).value ``` 其中,row和column参数分别示要提取的单元格的行和列,可以根据实际的需求进行修改。 5. 写入 可以创建一个Excel格,在其中写入提取特定数据。可以使用openpyxl库中的Workbook()函数来创建Excel格,使用create_sheet()函数创建工作,使用cell()函数写入单元格中的数据,代码示例如下: ``` import openpyxl # 加载Excel格 workbook = openpyxl.load_workbook(filename="example.xlsx") # 定位工作 worksheet = workbook["Sheet1"] # 提取特定数据 cell_value = worksheet.cell(row=2, column=3).value # 创建Excel格 new_workbook = openpyxl.Workbook() # 创建工作 new_worksheet = new_workbook.create_sheet(title="New Sheet") # 写入单元格中的数据 new_worksheet.cell(row=1, column=1, value=cell_value) # 保存Excel格 new_workbook.save(filename="new.xlsx") ``` 其中,“New Sheet”是工作的名称,“new.xlsx”是存储Excel格的文件名,可以根据实际的需求进行修改。 通过以上步骤,就可以方便地利用PythonExcel中的特定数据进行提取写入了。需要注意的是,在进行数据提取写入时,要根据Excel格中数据的具体结构进行代码编写,确保数据能够正确地提取写入。 ### 回答3: Python是一门在数据处理领域十分出色的编程语言,对于Excel中的数据提取写入来说也是非常便捷的。下面,本文将分步骤详细介绍如何利用PythonExcel中的特定数据进行提取写入。 1. 安装所需的库 首先,我们需要安装openpyxl库,它是Python处理Excel数据的好工具,可以通过以下命令进行安装: ``` pip install openpyxl ``` 2. 打开Excel文件 在Python中,我们可以使用openpyxl库下的Workbook()方法创建工作簿对象,使用load_workbook()方法打开Excel文件,如下所示: ```python from openpyxl import Workbook from openpyxl import load_workbook wb = load_workbook('example.xlsx') ``` 注意:上述代码需要导入openpyxl库。 3. 选定格和定义行列号 使用工作簿对象wb下的get_sheet_by_name()方法选定要处理的格,使用max_row和max_column方法获取格的最大行数和最大列数。另外,还可以定义一个行列变量用来指定起始和结束的行列号: ```python sheet = wb.get_sheet_by_name('Sheet1') start_row = 2 end_row = sheet.max_row start_col = 1 end_col = sheet.max_column ``` 注意:这里要按照你自己Excel文件的格名字和起始结束行列号进行相应修改。 4. 循环遍历数据 使用for循环语句进行遍历中的数据,将需要的数据提取出来,这里需要根据需求定义提取数据: ```python for row in range(start_row, end_row+1): cell1 = sheet.cell(row, start_col).value cell2 = sheet.cell(row, end_col).value if cell1 == "特定数据1": pass if cell1 == "特定数据2": pass ``` 注意:这里的"特定数据1"和"特定数据2"需要根据实际情况进行替换。 5. 写入格中 定义一个的工作簿变量new_wb,使用create_sheet()方法创建一个格。对于每一个需要提取特定数据,在格相应的单元格写入数据: ```python new_wb = Workbook() new_sheet = new_wb.create_sheet(title='New Sheet') for row in range(start_row, end_row+1): cell1 = sheet.cell(row, start_col).value cell2 = sheet.cell(row, end_col).value if cell1 == "特定数据1": new_sheet.cell(row, 1).value = cell1 if cell1 == "特定数据2": new_sheet.cell(row, 1).value = cell2 ``` 6. 保存关闭 使用工作簿对象new_wb下的save()方法将格保存到指定的文件,使用close()方法关闭打开的文件: ```python new_wb.save('result.xlsx') new_wb.close() ``` 至此,利用PythonExcel中的特定数据提取写入的步骤就结束了。如果按照以上步骤操作,应该能够顺利地完成这个任务。但请注意,在实际操作中,根据你自己的数据格式和需求情况进行相应的修改。
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值