import pandas as pd
# 定义一个函数来处理D列的单元格,提取第二个"/"之后的内容
def process_cell(cell):
if isinstance(cell, str): # 确保单元格内容是字符串
parts = cell.split('\\')
if len(parts) > 1:
return '\\'.join(parts[2:]) # 从第三个部分开始拼接
return cell
return cell
# 读取Excel文件
excel_path = 'E:\Project_feiyan_by_zr/excel_dataset.xlsx' # 替换成你的Excel文件路径
df = pd.read_excel(excel_path)
# 只选择B列和D列
df_selected = df[['C', 'D']]
# 处理D列数据
# 使用 .loc 来确保操作是在原始DataFrame上进行的
df_selected.loc[:, 'D'] = df_selected['D'].apply(process_cell)
# 保存到CSV文件,指定编码格式为utf-8-sig以避免乱码
csv_path = 'E:\Project_feiyan_by_zr/filenamewithlabel.csv' # 替换成你想要保存的CSV文件路径
df_selected.to_csv(csv_path, index=False, encoding='utf-8-sig')
print(f"Processed data has been saved to {csv_path}")
python脚本:提取excel文件指定列的特定符号之后的内容,并和其他列保存到新的文件中
于 2024-08-29 11:04:55 首次发布