关于用python与excel进行数据处理

本文介绍了如何使用Python处理Excel数据,适合有一定基础的Python小白。文章通过代码示例展示了如何整理原始数据,创建以公司为主题的两个独立表格,并完成特定数据的统计。提供了1400份数据处理前后的对比效果。
摘要由CSDN通过智能技术生成

**是比较老的问题了,现在有一个人问我,我想起来了,准备发个文章来水一水。

如果是python小白的话,有一定基础也可以看懂。

下面是代码块,我觉得没有什么必要讲,如果有问题可以留言。

代码只是随便写一写,排版不是那么好,勿喷!(主要是之前做的是车辆管理的程序)

from openpyxl import Workbook
from openpyxl import load_workbook


def xlsx_read(file):
    wb = load_workbook(file)
    data = []
    headers = None
    for row_no, row_data in enumerate(wb.worksheets[0].rows):
        if row_no == 0:
            headers = [c.value for c in row_data]
        else:
            data.append({
   headers[i]: row_data[i].value for i in range(len(headers))})

    wb.close()
    return data


def parse_data(data):
    company = {
   }
    for item in data:
        key = item["所属部门"]
        car_id = item['车牌号码']
        if key in company.keys():
            if car_id in company[key].keys():
                company[key][car_id].append(item)
            else:
                company[key][car_id] = [item]
        else:
            company[key] = {
   }
            company[key][car_id] = [item]
    return company


def statistic(car_id, car_data):
    over_drive = list(filter(lambda x: x["报警类型"] == "超速报警", car_data))
    tired_drive = list(filter(lambda x: x["报警类型"] == "疲劳驾驶", car_data))
    tired_drive_time = sum([int(x['持续时长(秒)']) for x in tired_drive])
    over_drive_time = sum([int(x['持续时长(秒)']) for x in over_drive])
    re_data = {
   'car_id': car_id
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值