import pandas as pd
import warnings
# 关闭警告显示
warnings.filterwarnings('ignore')
# 读取并查看【商品销售数据.xlsx】工作簿的数据
data = pd.read_excel('./商品销售数据.xlsx')
data.head(10)
data.info()
# 清洗【用户 ID】列的缺失值
data = data.dropna(subset=['用户 ID'])
# 查看清洗后的数据基本信息总结
data.info()
# 查找重复数据
data[data.duplicated()]
# 删除重复值
data = data.drop_duplicates()
# 查找