前段时间爬取了京东超市的全部商品品牌;拉去下来以后发现有很多的重复的内容,打算对这些内容进行去重。。
这是对excel的合并操作
import pandas as pd
import os
rootpath = os.getcwd()
abspath = os.path.dirname(rootpath)
# 桌面创建一个excel的文件夹,把要合并的文件放在excel里面
# 这个py文件的目录是desktop/demo/thisfile.py
excel_dir = abspath+'\excel'
os