在 Python 中,可以使用第三方库,如 pandas
和 openpyxl
等来完成 Excel 数据清理。
例如,可以使用 pandas
库读取 Excel 文件,然后使用 DataFrame
的方法对数据进行清理,如删除缺失值、去重、替换值等。最后,可以将清理后的数据写回到 Excel 文件中。
具体示例如下:
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('data.xlsx')
# 删除缺失值
df.dropna(inplace=True)
# 去重
df.drop_duplicates