信息搜集的方法
通过Whois信息搜集、目录扫描、指纹识别、端口探测、旁站、C端、等方法进行信息搜集
一、Whois信息:Whois是用来查询域名的IP以及所有者等信息的传输协议,可以用来查询域名是否已经被注册,以及注册域名的详细信息的数据库(如域名的所有人,域名注册商)
工具:Whois在线查询:(站长之家)
Whois查询到的信息可以用来社工或者根据邮箱手机号进行密码组合用以爆破。
二、域名:域名分为顶级域名,一级域名,二级域名和三级域名
顶级域名:.com .edu .gov .mil
一级域名:qq.com
二级域名:ka.qq.com
三级域名:zhc.ke.qq.com
可以理解为有几个点就是几级域名
工具:layer子域名挖掘机
三、端口探测(工具:Nmap(Kali自带))
端口负责网络通信=>端口对应服务
3389端口(远程桌面连接)
3306端口(MySQL)
80端口(http协议)
Windows->3389端口
Linux->22端口
同端口代表同一个服务器/内网
1.什么是端口?在网络技术中端口分为两种:
(1)物理端口:也称接口,如USB端口。
(2)逻辑端口:一般指TCP/IP协议中的端口,如用网页浏览的80端口。
端口其实就是队,操作系统为各个进程分配了不同的队,数据包按照目的端口被推入不同的队中。
2.有多少个逻辑端口? 0~65535也就是65536个逻辑端口
3.端口的分类:
(1)周知端口:周知端口是众所周知的端口号,范围从0~1023
(2)动态端口:动态端口一般不固定分配某种服务,而是动态分配,范围从49152~65535
(3)注册端口:分配给用户进程或应用程序,这些进程主要是用户安装的一些应用程序,而不是已经分配好的公认端口的常用程序,这些端口在没有服务器资源占用的时候,可以用用户端动态端口选用为源端口,范围从1024~49151
四、目录扫描(目录即文件夹)
工具:御剑 微步社区
用御剑等工具进行目录扫描查看robots.txt信息(robots.txt君子协议,告诉网络搜索引擎不要去爬这些目录里的东西,防止爬虫)
目录扫描搜索网站的后台在哪里或者里面一些文件在哪,回显为200说明存在,不是200说明不存在。
目录扫描有可能扫到压缩包或配置文件,后台地址以及其他一些目录。(目录扫描拼的是字典)
五、指纹识别
工具:御剑 微步社区 云悉资产
1.为什么要指纹识别?
网站的指纹=网站的特征=中间件 数据库 使用什么CMS(通用的框架网站)
2.什么是Web指纹?
就像生物的指纹是该生物的特征一样,应用程序多多少少含有一些特征码,这些就是该程序的指纹。
3.指纹识别有什么用?
识别出相应的CMS或者Web容器才能查找出相关漏洞。
六、旁站查询
工具:站长之家搜索旁站
七、C端:确定ip的范围,然后对其段内的IP主机进行信息搜集。
八、内容敏感信息泄露
各种包含敏感信息的东西
工具:谷歌镜像站
1.一些谷歌语法
谷歌语法不止能收集信息,还可以找到别人的后台(eg:site.edu.cn后台管理)
如:搜索到有些企业网站的后台管理,有些是CMS,可以取=去云悉或者是微步看一看是不是CMS。
2.什么是Google hacking?
Google hacking(谷歌黑客)原指利用谷歌搜索引擎搜索信息来进行入侵的技术和行为,他们使用搜索引擎,比如Google来定位因特网上的安全隐患和易攻击点,熟练使用google语法,利用关键词进行渗透行为。
3.Google语法
“ ” -->双引号内的内容不可拆分
site-->指定域名 eg:site:ke.qq.com
Inurl-->URL存在关键字的网页eg:inurl:login
Intext-->网页正文中的关键字
Filetype-->指定文件类型
Intitle-->网页标题中的关键字
link--> Limk:zkaq.org表示所有和zkaq.org做了链接的url
Info-->查找指定站点的一些基本信息
组合使用: eg:site:samwo.com/ inurl:login