虽然excel也能够很简单的实现,但是用Python也未尝不是一种新思路,可以自己试着把文件路径改下,自己体验。
import xlrd
from collections import Counter
import os
pathd = 'C:/Users/我是弱智/Desktop/新建文件夹/'#文件存储所在文件夹
files = []
for i in os.listdir(pathd):#os.listdir(pathd)这是文件名,如:xxx.xls
filed = os.path.join(pathd, i)# 文件绝对路径
files.append(filed)
len_file = len(files)
list_all = []
a = 0
while a<len_file:
data = xlrd.open_workbook(f"{files[a]}")#获取单个路径
sheet = data.sheet_by_index(0)#获取列表
name= sheet.col_values(2,start_rowx=1)#从第二行的第三列开始往下获取数据
for e in name:
list_all.append(e)#把所有的目标数据都加到列表中去,不管重不重复,这点就是我们要求的,这样后面才能利用counter函数进行统计
a += 1
# print(list_all)
list_count = Counter(list_all)#统计每个元素出现了多少次,重点在这个地方
list_dict = dict(Counter(list_all))#将统计到的结果转换成字典,并把元素和出现次数做成一个字典
# print(list_count)
# print(list_dict)
gb = list_dict.items()#就是把每一组字典做成一个元组
# print(gb)
for key,value in list_dict.items():#字典调用items,并切片
if value>1:#当重复次数的值大于1时便打印出来
print(key,value)