用Python实现从文件夹中提取多个excel列表的重复值

h123t3

已于 2022-04-28 15:38:57 修改

阅读量2.2k

点赞数 2

文章标签： python

于 2022-04-28 09:55:16 首次发布

本文链接：https://blog.csdn.net/h123t3/article/details/124466977

版权

虽然excel也能够很简单的实现，但是用Python也未尝不是一种新思路，可以自己试着把文件路径改下，自己体验。

import xlrd
from collections import Counter
import os

pathd = 'C:/Users/我是弱智/Desktop/新建文件夹/'#文件存储所在文件夹

files = []
for i in os.listdir(pathd):#os.listdir(pathd)这是文件名，如：xxx.xls
    filed = os.path.join(pathd, i)# 文件绝对路径
    files.append(filed)
len_file = len(files)
list_all = []
a = 0
while a<len_file:

    data = xlrd.open_workbook(f"{files[a]}")#获取单个路径

    sheet = data.sheet_by_index(0)#获取列表

    name= sheet.col_values(2,start_rowx=1)#从第二行的第三列开始往下获取数据

    for e in name:
        list_all.append(e)#把所有的目标数据都加到列表中去，不管重不重复，这点就是我们要求的，这样后面才能利用counter函数进行统计
    a += 1
# print(list_all)
list_count = Counter(list_all)#统计每个元素出现了多少次，重点在这个地方
list_dict = dict(Counter(list_all))#将统计到的结果转换成字典,并把元素和出现次数做成一个字典
# print(list_count)
# print(list_dict)
gb = list_dict.items()#就是把每一组字典做成一个元组
# print(gb)
for key,value in list_dict.items():#字典调用items，并切片
    if value>1:#当重复次数的值大于1时便打印出来
        print(key,value)