import pandas as pd
data1 = pd.read_excel(根据具体情况定)(r'文件路径')#获取数据
data1.head()#查看前五行数据
data1['品牌名称']
len(data1['品牌名称'])#求个数
【去重:方法一】
my_pro=[]#存储去重后的品牌名称
for i in data1['品牌名称']:
# print(i)
if i not in my_pro:
my_pro.append(i)
print(my_pro)#打印出去重后的品牌名称
print(len(my_pro))#打印出去重后的品牌数量
【去重:方法二(利用set函数)】
print(set(data1['品牌名称']))
#使用drop_duplicates去重
data2 = data1.copy()#复制一份,以免影响原有数据
data2['品牌名称'].drop_duplicates()
#默认inplace为Flase,此时data2被改变,若令inplace为True即
data2.drop_duplicates(subset='品牌名称',inplace=True)
则data2改变
data1_drop=data1.drop_duplicates(subset=['母婴用品名称','品牌名称'])#去重两列相同的数据
print(data1_drop)