查找包含某字符串的文件 - (python/shell)

想操作一个DbUtil类,现在要找出工程里,哪些方法使用了DbUtil类的方法。

一、不过刚好想试试python,就边查边写了python脚本来做。
思路是,找出工程中所有java文件,读取文件内容,如果找到com.util.DbUtil语句,就返回文件名。
代码:

# -*- coding: utf-8 -*-
import os
import re
import codecs
#找到所有文件
def iter(path):
    for home, dirs, files in os.walk(path):
        for filename in files:
            yield os.path.join(home, filename)
#找到使用该类的文件,用正则匹配
def getfiles(filename,encode):
        filenames = []
        path = "E:\\workspace\\" + filename 
        for fullname in iter(path):
                if os.path.splitext(fullname)[1] == '.java':
                        file = codecs.open(fullname, 'r',encode)
                        for line in file:
                                if re.match(r'.*com.util.app.DbUtil.*',line):
                                        filenames.append(fullname)
                                        break
                        file.close()
        out = codecs.open('d:\\cfile\\'+filename+'.txt','w')
        print(filename,file=out)
        print(filenames,file=out)
        out.close()
        print(filename," ok")
#由于几个工程使用编码不同(编码问题好坑),所以分两次查找,一类是utf-8,一类是gbk。
if __name__ == '__main__':
    names = ['compensation','cost','shr_cost','social']
    difnames = ['shr_compensation','shr_social']
    for name in difnames:
            getfiles(name,'gbk')
    for name in names:
            getfiles(name,'utf-8')

最近喜欢尝试新东西,python还是挺好用的。不过编码还是要注意。用codecs库可以使用不同的编码方式。

二、发现Linux 命令更简洁。

寻找包含“com.util.app.DbUtil”的java文件,输出结果用awk分割,’:’前是文件路径,后面是匹配的文件行内容,最后把文件名追加到result中。

find . -name *.java | xargs grep "com.util.app.DbUtil" | awk -F ':' '{print $1}'>> result

interesting!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值