defaudit(arg):#defaultrootdirectorynamesurl=arghost=util.get_url_host(url)ifre.match('^\w+://[\w\-\.]+/$',url):zip_root=['wwwroot','htdocs','site','www','default','web']z...
def audit(arg):
# default root directory names
url = arg
host = util.get_url_host(url)
if re.match('^\w+://[\w\-\.]+/$', url):
zip_root = ['wwwroot', 'htdocs', 'site', 'www', 'default', 'web']
zip_root.append(host)
zip_root.append(host.replace('.',''))
zip_root.append(host.replace('.','_'))
root = util.get_domain_root(host)
zip_root.append(root)
zip_root.append(root.replace('.',''))
zip_root.append(root.replace('.','_'))
# abc.123.baidu.com => ['abc', '123']
if root != host:
keys = host.replace('.' + root,'').split('.')
zip_root += keys
# baidu.com.cn => baidu
zip_root.append(root.split('.')[0])
for name in set(zip_root):
if excavate_zip(url, name):
break
else:
m = re.match('^(\w+://.*/)([^/]+)/', url)
if m:
if not excavate_zip(url, m.group(2)):
excavate_zip(m.group(1), m.group(2))
展开