文章目录
什么是内容发现?
一般来说是指不容易被公共访问到的
比如一些配置文件,管理员面板,备份文件等等,
发现的方式:手动,自动,OSINT,
1.robots.txt
本意是限制搜索引擎爬虫的,但是也可以给攻击者带来信息
2.Favicon
可以标识某些框架或者同类网站,fofa等搜索引擎也可以进行搜索
owasp有一个icon库 https://wiki.owasp.org/index.php/OWASP_favicon_database
下面我们来尝试一下
执行命令得到这个icon的md5 hash
curl https://static-labs.tryhackme.cloud/sites/favicon/images/favicon.ico | md5sum
然后就可以从owasp的库里找到了
3.Sitemap.xml
它会列出希望在搜索引擎上搜到的,里面可能会含有一些不容易找到的页面,历史页面等
4.HTTP Headers
http头中可能含有一些有用的信息,比如服务器类型,开发框架,语言,
user@machine$ curl http://10.10.160.76 -v
* Trying 10.10.160.76:80...
* TCP_NODELAY set
* Connected to MACHINE_IP (MACHINE_IP) port 80 (#0)
> GET / HTTP/1.1
> Host: MACHINE_IP
> User-Agent: curl/7.68.0
> Accept: */*
>
* Mark bundle as not supporting multiuse
< HTTP/1.1 200 OK
< Server: nginx/1.18.0 (Ubuntu)
< X-Powered-By: PHP/7.4.3
< Date: Mon, 19 Jul 2021 14:39:09 GMT
< Content-Type: text/html; charset=UTF-8
< Transfer-Encoding: chunked
< Connection: keep-alive
用curl -v 模式,
5.手动发现 关于框架的资产
查看源代码等,发现一些目录
然后就是找到框架,可以审计源代码,开发手册等,
到框架网站上,可以发现登录页面,默认密码
以及,以前的备份文件等
6.google dorking/hacking
谷歌搜索的高级语法
了解更多:https://en.wikipedia.org/wiki/Google_hacking
7.Wappalyzer
谷歌、火狐浏览器有个插件,这个可以识别网站用了那些编程语言,框架等
8.历史页面
这个网站可以追溯web站点曾经的样子,可以从这上面获取信息,(比如一些删掉的页面等)
谷歌的历史快照也是可以的。
9.github
github可能会留有开发者的信息,或者一些敏感信息,比如邮箱,密码,后台,等等
10.S3等存储
http(s)😕/{name}.s3.amazonaws.com
**{name}**assets, **{name}**www, **{name}**public, **{name}**private, etc.
11.自动探测(文件 目录 api 子域名 等
最重要的是字典!
kali自带的三种
ffuz
ffuf -w /usr/share/wordlists/SecLists/Discovery/Web-Content/common.txt -u http://MACHINE_IP/FUZZ
dirb
dirb http://MACHINE_IP/ /usr/share/wordlists/SecLists/Discovery/Web-Content/common.txt
gobuster
gobuster dir --url http://MACHINE_IP/ -w /usr/share/wordlists/SecLists/Discovery/Web-Content/common.txt