python脚本：提取excel文件指定列的特定符号之后的内容，并和其他列保存到新的文件中

深度学习小白研究生历险

已于 2024-08-29 20:49:19 修改

阅读量106

点赞数 2

文章标签： excel python 开发语言

于 2024-08-29 11:04:55 首次发布

本文链接：https://blog.csdn.net/weixin_43719945/article/details/141673438

版权

import pandas as pd

# 定义一个函数来处理D列的单元格，提取第二个"/"之后的内容
def process_cell(cell):
    if isinstance(cell, str):  # 确保单元格内容是字符串
        parts = cell.split('\\')
        if len(parts) > 1:
            return '\\'.join(parts[2:])  # 从第三个部分开始拼接
        return cell
    return cell

# 读取Excel文件
excel_path = 'E:\Project_feiyan_by_zr/excel_dataset.xlsx'  # 替换成你的Excel文件路径
df = pd.read_excel(excel_path)

# 只选择B列和D列
df_selected = df[['C', 'D']]

# 处理D列数据
# 使用 .loc 来确保操作是在原始DataFrame上进行的
df_selected.loc[:, 'D'] = df_selected['D'].apply(process_cell)

# 保存到CSV文件，指定编码格式为utf-8-sig以避免乱码
csv_path = 'E:\Project_feiyan_by_zr/filenamewithlabel.csv'  # 替换成你想要保存的CSV文件路径
df_selected.to_csv(csv_path, index=False, encoding='utf-8-sig')

print(f"Processed data has been saved to {csv_path}")