最近刚开始学python,正好实习工作中遇到对excel中的数据进行处理的问题,就想到利用python来解决,也恰好练手。
实际的问题是要从excel表中提取日期、邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思)。首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成。
要用的库一个是对excel读写处理的,一个事正则表达式的库。因为xlwt和xlrd只能对03版以前的excel处理,所以我选择了openpyxl。以下代码就是自己敲的,写了对日期和邮件地址的提取,最后出来效果不错,仅供大家参考,欢迎交流与改进。
import openpyxl
import re
def Exceldivide(file_dir):
wb=openpyxl.load_workbook(file_dir) #打开原有的excel表
sheet=wb.get_sheet_by_name('Sheet1')
tuple(she

本文介绍使用Python和正则表达式从Excel中提取日期与邮件地址的方法,并统计特定时间段内个人项目时间,最终创建数据透视表。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



