import pandas as pd
# 读取Excel文件
file = r"D:\\pythonXangmu\\quchong\\quchong.xlsx" # 使用原始字符串以避免转义字符
df = pd.read_excel(file, sheet_name='nameSheet')
# 删除重复值(单元格)
df2 = df.drop_duplicates(subset='name')
# 从列中提取值
names = df2['name'].astype(str).tolist() # 将name列转换为字符串类型,解决单元格里有纯数字报不是int问题
ages = df2['age'].tolist()
# 删除单元格内重复值
unique_names = ["".join(set(name)) for name in names]
# 创建一个新的DataFrame
df3 = pd.DataFrame({'name': unique_names, 'age': ages})
# 将新的DataFrame写入Excel文件
df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong5.xlsx', sheet_name='Sheet1', index=False)
# 读取新创建的Excel文件
df5 = pd.read_excel('3quchong5.xlsx', sheet_name='Sheet1')
print('去重后5\n', df5)
Excel 单元格去重及单元格内容去重
最新推荐文章于 2024-11-10 23:51:25 发布