开源框架源码,【python(28),这是一份面向Python开发者的复习指南

| 刘三 | 财务部 | 2024年 | 12月 | 完成修炼科目8 |
| 刘三 | 财务部 | 2022年 | 9月 | 完成修炼科目7 |
| 刘三 | 财务部 | 2022年 | 10月 | 完成修炼科目8 |
| 刘三 | 财务部 | 2022年 | 11月 | 完成修炼科目9 |
| 刘三 | 财务部 | 2023年 | 12月 | 完成修炼科目10 |
| 刘三 | 财务部 | 2023年 | 9月 | 完成修炼科目11 |
| 刘三 | 财务部 | 2023年 | 10月 | 完成修炼科目12 |
| 刘三 | 财务部 | 2023年 | 11月 | 完成修炼科目13 |
| 刘三 | 财务部 | 2023年 | 12月 | 完成修炼科目14 |

输出结果展示

1.xlsx

2.xlsx

3.xlsx

想筛选自己想要的数据就得多加筛选条件,具体放在什么位置得看情况,主打就是一个变通。

还得一步一步的调试。

代码如下:

import pandas as pd
import re

def rename_on_keywords(text, keywords):
for keyword in keywords:
if keyword in text:
return keyword
return text

def merge_groups_on_keywords(text, keywords):
for keyword in keywords:
groups = re.findall(f’([、]*{keyword}[、]*(\d+))‘, text)
counts = [int(re.search(’((\d+))‘, group).group(1)) for group in groups]
if groups:
text = text.replace(groups[0], f’{keyword} ({sum(counts)})‘)
for group in groups[1:]:
text = text.replace(’、’ + group, ‘’)
return text

读取 Excel 文件

df = pd.read_excel(‘kq.xlsx’, engine=‘openpyxl’)

列名定义

column1_name = ‘姓名’
column2_name = ‘年’
column3_name = ‘月’
column4_name = ‘当月完成工作’
column5_name = ‘年’
column6_name = ‘月’
column_to_rename = ‘月’
keywords = [‘12月’]

定义你想要排除的特定值列表

specific_values4 = [‘出差’]
specific_values5 = [‘2024’]
specific_values6 = [‘11’]

排除 ‘Column4’ 和 ‘Column5’ 中等于特定值列表的行

df = df[~df[column4_name].isin(specific_values4) & ~df[column5_name].isin(specific_values5)& ~df[column6_name].isin(specific_values6)]

对于每个 ‘姓名’,在其对应的列中,找出包含特定关键字的唯一值,并将这些值替换为关键字本身

df[column_to_rename] = df.groupby(column1_name)[column_to_rename].transform(lambda x: x.apply(lambda y: rename_on_keywords(y, keywords)))

对 Column1 进行分组,并将每个组的 Column2 和 Column3 值合并为一个字符串,并计算每个字符串的出现次数

merged = df.groupby(column1_name).apply(lambda x: ‘、’.join([f’{v} ({c})’ for v, c in (x[column2_name] + ’ ’ + x[column3_name]).value_counts().items()]))

将结果转换为 DataFrame

merged_df = merged.reset_index()
merged_df.columns = [column1_name, ‘Merged_’ + column2_name + ‘_’ + column3_name]

将结果保存到新的 Excel 文件中

merged_df.to_excel(‘1.xlsx’, index=False)

读取保存的 Excel 文件

df = pd.read_excel(‘1.xlsx’)

列名定义

column2_name = ‘Merged_年_月’

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img



既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
img

记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
[外链图片转存中…(img-fCOydklg-1712532357187)]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值