python脚本:提取excel文件指定列的特定符号之后的内容,并和其他列保存到新的文件中

import pandas as pd

# 定义一个函数来处理D列的单元格,提取第二个"/"之后的内容
def process_cell(cell):
    if isinstance(cell, str):  # 确保单元格内容是字符串
        parts = cell.split('\\')
        if len(parts) > 1:
            return '\\'.join(parts[2:])  # 从第三个部分开始拼接
        return cell
    return cell

# 读取Excel文件
excel_path = 'E:\Project_feiyan_by_zr/excel_dataset.xlsx'  # 替换成你的Excel文件路径
df = pd.read_excel(excel_path)

# 只选择B列和D列
df_selected = df[['C', 'D']]

# 处理D列数据
# 使用 .loc 来确保操作是在原始DataFrame上进行的
df_selected.loc[:, 'D'] = df_selected['D'].apply(process_cell)

# 保存到CSV文件,指定编码格式为utf-8-sig以避免乱码
csv_path = 'E:\Project_feiyan_by_zr/filenamewithlabel.csv'  # 替换成你想要保存的CSV文件路径
df_selected.to_csv(csv_path, index=False, encoding='utf-8-sig')

print(f"Processed data has been saved to {csv_path}")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值