提取excel文件里面的几行数据到另外一个excel里面(进阶版)

提取Excel文件里"自定义标签"列里面"key"的内容,"自定义标签"的内容格式:{"key1":"value1","key2":"value2"}
# 安装包:pip install openpyxl xlrd pandas
import pandas as pd
import json

# 读取源 Excel 文件,文件名要和脚本在同一路径下,也可以写文件路径
source_file = '2024-12-23.xls'  # 源文件名
output_file = '2024-12-23-filter.xlsx'  # 输出文件名

# 指定需要提取的列
columns_to_extract = ['统计日期','工单负责人','工单链接','一级标签','二级标签','三级标签','自定义标签']

# 读取Excel文件
# 对于 .xlsx 文件
# df = pd.read_excel('your_file.xlsx', engine='openpyxl')
# 对于 .xls 文件
df = pd.read_excel(source_file,engine='xlrd')

# 提取所需的列
extracted_data = df[columns_to_extract]

# 将提取的数据写入新的Excel文件
# 第一种写法
extracted_data.to_excel(output_file, index=False)
# 第二种写法
# pd.DataFrame(extracted_data).to_excel(output_file,index=False)

print(f"自定义列已成功提取并保存到 {output_file}")


# 提取Excel文件里"自定义标签"列里面"备注"的内容,"自定义标签"的内容格式:{"key1":"value1","key2":"value2"}
file_path = output_file
# 读取文件
df = pd.read_excel(file_path)

# 处理的列名为 '自定义标签'
column_name = '自定义标签'  # 替换为您需要处理的列名
# 需要提取的key
key = "备注"

# 定义一个函数来提取 "备注" 的值
def extract_key(json_str):
    try:
        json_obj = json.loads(json_str)
        return json_obj.get(key, "")  # 如果找不到 "备注",则返回空字符串
    except (json.JSONDecodeError, TypeError):
        return ""  # 如果解析失败,则返回空字符串

df[column_name] = df[column_name].apply(extract_key)
# 将结果写回到原来的 Excel 文件
df.to_excel(file_path, index=False)

print("已成功提取'"+key+"'的值,并覆盖原来的"+file_path+"'自定义标签'的列")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr'刘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值