python实现查找某个路径下所有的文件是否包含某个字符串

python实现查找某个路径下文件是否有某个字段,用的python3.6

 

#coding=utf8
import os
#import tkFileDialog
    
def readFilename(file_dir):
    for root, dirs, files in os.walk(file_dir): 
        return files,dirs,root
 
def findstring(pathfile):
    fp = open(pathfile, "r",encoding='UTF-8')#注意这里的打开文件编码方式
    strr = fp.read()
    #print strr.find("DoubleVec")
    if(strr.find("trimQuotation") != -1):
        print ('here?')
        return True
    return False
    
def startfind(files,dirs,root):
    for ii in files:
        #print(ii)
        #if ii.endswith('.lua'):
        try:
            if(findstring(root+"\\"+ii)):
                print (ii)
        except Exception as err:
            print(err)
            continue
            
                
    for jj in dirs:
        fi,di,ro = readFilename(root+"\\"+jj)
        startfind(fi,di,ro)
    
if __name__ == '__main__':
    default_dir = u"E:\\RZRKCode"  # 设置默认打开目录
    file_path = default_dir#th.expanduser(default_dir)))
    files,dirs,root = readFilename(file_path)
    startfind(files,dirs,root)

上面的代码还是有一些问题,当文档编码是gbk的是被catch了。 

下面给出一个查找所有文档的ip地址

#coding=utf8
import os
import re
pattern = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})')
    
def readFilename(file_dir):
    for root, dirs, files in os.walk(file_dir): 
        return files,dirs,root
 
def findstring(pathfile,edcode):
    fp = open(pathfile, "r",encoding=edcode)#注意这里的打开文件编码方式
    strr = fp.read()
    txt = pattern.findall(strr)
    if txt != []:
        print (txt)
        return True
    return False
    
def startfind(files,dirs,root):
    for ii in files:
        try:
            if(findstring(root+"\\"+ii,'utf-8')):
                print (root,ii)
        except Exception as err:
            try:
                    
                if(findstring(root+"\\"+ii,'gbk')):
                    print (root,ii)
            except Exception as er:
                continue
            
            
                
    for jj in dirs:
        fi,di,ro = readFilename(root+"\\"+jj)
        startfind(fi,di,ro)
    
if __name__ == '__main__':
    default_dir = u"D:\\zd_gdzq"  # 设置默认打开目录
    file_path = default_dir
    files,dirs,root = readFilename(file_path)
    startfind(files,dirs,root)


good luck!

 

  • 5
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值