查了好多资料,发现还是不全,干脆自己整理吧,至少保证在我的做法正确的,以免误导读者,也是给自己做个记录吧!
在文中grep现实例子中,没有斟酌子目录的理处,因为如果直接open目录行进读作操会涌现错误,所以求要读者修改这个示例代码以便斟酌到子目录这类特殊情况,然后把最后摸索出的 cdcGrep()嵌入 pycdc-v0.5.py 现实现实本版的 PyCDC。
根据CDays-2 中的源码,我们可以道知他列出了有所文件,并没有列出子目录。
根据我们在之前做光盘遍历的教训,我们重写cdcGrep( )
根据path中的法方isdir,我们可以根据os.path.isdir( ) 的返回值定确是不是为目录。
def cdcGrep(cdcpath,keyword): '''光盘信息本文关键词搜索函式 @note: 应用最单简的内置字串配匹理处来判断是不是有关键词含包 @param cdcpath: 含包*.cdc 文件的目录 @param keyword: 搜索的关键词 @return: 组织配匹好的信息到字典中出导成 searched.dump 文件 @todo: 可合结搜索引擎行进模糊搜索! ''' expDict = {} filelist = os.listdir(cdcpath) # 搜索目录中的文件 cdcpath=cdcpath+"/" for cdc in filelist: # 环循文件列表 if os.path.isdir(cdcpath+cdc): cdcGrep(cdcpath+cdc,keyword) # 若是子目录,则递归调用现实查找 else: cdcfile = open(cdcpath+cdc) # 拼合文件路径,并打开文件 for line in cdcfile.readlines(): # 读取文件每一行,并环循 if keyword in line: # 判断是不是有关键词行在中 #print line # 打印输出 expDict[cdc].append(line) #print expDict pickle.dump(expDict,open("searched.dump","w"))
文章结束给大家分享下程序员的一些笑话语录: 不会,Intel会维持高利润,也会维持竞争局面,国外的竞争不是打死对方的那种。你看日本有尼康,佳能,索尼,都做相机,大家都过得很滋润。别看一堆厂,其实真正控制的是后面的那几个财团——有些竞争对手,后面其实是一家人。