python计算时间差(排除非工作日)

python pandas模块计算时间差(排除非工作日)
所需调用以下包

import numpy as np 
import pandas as pd 
import csv
import datetime
from dateutil.parser import parse

1.读取csv文件
shixiao_data = pd.read_csv(’/soft/data/case_data/shixiao_test.csv’,encoding=‘gbk’)
2.创建非工作日日期集合
nonworkday = [‘2020-01-01’, ‘2020-01-04’, ‘2020-01-05’, ‘2020-01-11’, ‘2020-01-12’, ‘2020-01-18’, ‘2020-01-24’, ‘2020-01-25’, ‘2020-01-26’, ‘2020-01-27’, ‘2020-01-28’, ‘2020-01-29’, ‘2020-01-30’, ‘2020-02-02’, ‘2020-02-08’, ‘2020-02-09’, ‘2020-02-15’, ‘2020-02-16’, ‘2020-02-22’, ‘2020-02-23’, ‘2020-02-29’, ‘2020-03-01’, ‘2020-03-07’, ‘2020-03-08’, ‘2020-03-14’, ‘2020-03-15’, ‘2020-03-21’, ‘2020-03-22’, ‘2020-03-28’, ‘2020-03-29’, ‘2020-04-04’, ‘2020-04-05’, ‘2020-04-06’, ‘2020-04-11’, ‘2020-04-12’, ‘2020-04-18’, ‘2020-04-19’, ‘2020-04-25’, ‘2020-05-01’]
3.计算某一段时间非工作日个数自定义函数:
输入t1,t2,对非工作日集合进行遍历判断

def nonworkday_cnt(created_time, last_second_audit_time):
    nonworkday_set = [] 
    create_day = created_time[:10]
    last_second_audit_day = last_second_audit_time[:10]
    for day in nonworkday:
        if ((day >= create_day) & (day <= last_second_audit_day)):
            nonworkday_set.append(day)
    return(len(nonworkday_set))

#到这一步可以注册udf函数,在spark中调用(spark.udf.register(‘nonworkday_cnt’,nonworkday_cnt,LongType()))

SELECT *, nonworkday_cnt(t1,t2) AS nonworkday_cnt
FROM ***

此处今天介绍纯python 处理数据
4.pandas读取csv文件
(1) lambda函数调用计算某一段时间非工作日个数自定义函数:

shixiao_data['nonworkday_cnt'] = shixiao_data['level_0'].apply(lambda x: nonworkday_cnt(shixiao_data.created_time[x], shixiao_data.last_second_audit_time[x]))

(2)计算t1,t2时间差,运用total_seconds函数实现:

shixiao_data['total_timediff'] = shixiao_data['level_0'].apply(lambda x: (parse(shixiao_data.last_second_audit_time[x]) - parse(shixiao_data.created_time[x])).total_seconds())
print(shixiao_data)

(3)排除非工作日时间差 =(总时间差 - 非工作日天数*24*60 )

shixiao_data['real_timediff'] = shixiao_data['level_0'].apply(lambda x: (shixiao_data.total_timediff[x] - shixiao_data.nonworkday_cnt[x]*24*60*60)/60/60)
print(shixiao_data)

以某一列为维度计算平均值:

shixiao_data["real_timediff_avg"] = shixiao_data['real_timediff'].mean()
print('总时效')
print(shixiao_data.real_timediff_avg[1])

That’s all,thanks!!!

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python计算工作日排除法定节假日)的方法主要包括以下几个步骤: 1. 首先,我们需要先获取法定节假日的列表,可以通过网络查询或者其他途径获取。法定节假日通常是固定的,例如元旦、春节、劳动节等。 2. 根据获取的法定节假日列表,我们可以创建一个包含所有节假日日期的集合。 3. 接下来,我们需要引入datetime模块来进行日期的计算。这个模块提供了处理日期和时间的相关函数和类。 4. 首先,我们可以定义一个函数来计算两个日期之间的天数差。可以使用datetime模块中的date类的substract方法来实现。 5. 然后,我们可以定义一个函数来计算两个日期之间的工作日数量。首先计算两个日期之间的天数差,然后减去周末的天数和法定节假日的天数即可。 6. 最后,我们可以将上述两个函数结合起来,计算出指定日期范围内的工作日数量。 下面是一个示例代码,用于计算2022年3月1日至2022年4月30日之间的工作日数量(排除法定节假日): ```python import datetime public_holidays = [ # 根据实际情况添加法定节假日的日期 datetime.date(2022, 4, 4), # 清明节 datetime.date(2022, 5, 1) # 劳动节 ] def get_working_days(start_date, end_date): days = (end_date - start_date).days + 1 working_days = days for i in range(days): date = start_date + datetime.timedelta(days=i) if date.weekday() >= 5 or date in public_holidays: working_days -= 1 return working_days start_date = datetime.date(2022, 3, 1) end_date = datetime.date(2022, 4, 30) working_days = get_working_days(start_date, end_date) print(f"工作日数量:{working_days}") ``` 上述代码中,我们首先定义了一个public_holidays列表,其中包含了2022年的清明节和劳动节日期。然后,我们通过get_working_days函数计算了2022年3月1日至2022年4月30日之间的工作日数量,并将结果打印输出。 这样,我们就可以用Python计算工作日排除法定节假日)了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值