Google Hacking 搜索引擎攻击与防范

Google Hacking,又称Google dorking,是一种利用高级搜索技巧来收集信息的技术。黑客可以利用这种方法查找安全漏洞、收集目标信息。本文介绍了Google Hacking的基础、高级操作符、应用以及防范措施,如合理设置robots.txt和NOARCHIVE标签。此外,还提到了其他搜索引擎如ZoomEye和Shodan在安全信息搜索中的应用。
摘要由CSDN通过智能技术生成

Google Hacking,有时也会被称为 Google dorking,是一种利用谷歌搜索的高级使用方式进行信息收集的技术。这个概念最早在2000年由黑客 Johnny Long 提出并推广,一系列关于 Google Hacking 的内容被他写在了《Google Hacking For Penetration Testers》一书中,并受到媒体和大众的关注。在 DEFCON 13的演讲上,Johnny 创造了 “Googledork” 这个词,“Googledork” 指的是“被 Google 透露了信息的愚蠢、无能的人们”。这是为了引起人们注意到,这些信息能被搜索到并不是 Google 的问题,而是由用户或用户安装程序时无意识的错误配置造成的。随着时间的推移,“dork” 这个词成为了“定位敏感信息的搜索”这个行为的简称。

黑客们可以使用 Google 的高级操作符搜索那些易被攻击的 Web 应用程序或者特定文件类型( .pwd.sql…), 查找 Web 应用程序中的安全漏洞、收集目标信息、发现泄露的敏感信息或错误消息以及发现包含凭据和其他敏感数据的文件。

虽然 Google 在国内无法直接访问,但作为技术人员,理应找到恰当的访问途径。另外这种技术虽然名为 “Google Hacking”,但同样的思路,类似的搜索技巧,也是完全适用于其他搜索引擎的。所以这里仅是抛砖引玉性质的介绍,触类旁通地可以灵活应用在其他的搜索场景里,只需要注意各种搜索引擎在搜索操作符operator)使用上的细小差异。

一、搜索基础点

  1. 可以使用双引号 ( " " ) 进行短语搜索;
  2. 关键字不区分大小写;
  3. 可以使用通配符 ( * );
  4. 会在搜索中忽略一些词语,这些词语被称为 stop words,比如:how,where 等;
  5. 关键词最多可以有32个词语,但 Google 并不会把通配符 ( * ) 算入关键词的长度,所以可以使用通配符扩展搜索内容的长度;
  6. 布尔运算符和特殊字符:
  • + 加号 (AND)
    会强制搜索加号后面跟随的单词,后面不能有空格。使用加号可以让那些 Google 默认忽略的单词可以被搜索;
  • - 减号 (NOT)
    会强制忽略减号后面跟随的单词,后面也不能有空格;
  • | 管道符 (OR)
    会在搜索中搜索被管道符分割的关键词中的任意一个。

二、高级操作符

在 Google Hacking 中可以使用高级运算符,以缩小搜索结果范围,最终获取到需要的信息。高级操作符虽然容易使用,但也需要遵循严格的语法。

1. 需要知道

  • 基本语法是:operator:search_term ,当中不能有空格
  • 布尔运算符和高级操作符可以结合使用;
  • 多个高级操作符可以在一次搜索中配合使用;
  • all 开头的操作符在一次搜索中仅能使用一次,不能与其他高级操作符同时使用。

2. 基本操作符(operator)

· intitle & allintitle ·

使用 intitle 可以搜索网页的的标题,标题指的是在 HTML 中的 title 标签的内容。比如搜索 intitle:"Index of" 会返回所有 title 标签中含有关键字短语 “Index of” 的搜索结果。

allintitle 的使用方法和 intitle 类似,但 allintitle 后面可以跟随多个内容。比如

allintitle:"Index of""backup files"

返回所有 title 标签中含有关键字短语 Index ofbackup files 的搜索结果。

但使用 allintitle 会有很大的限制,因为这样搜索的内容只会限制于返回 intitle 的内容,而不能使用别的高级操作符。在实际使用中,最好使用多个 intitle,而不是使用 allintitle。

· allintext ·

这个是最容易理解的一个操作符,作用就是返回那些包含搜索内容的页面。当然,allintext 不能与其他高级操作符结合使用。

· inurl & allinurl ·

在介绍过 intitle 后,inurl 其实也很好理解:可以搜索网页 url 的内容。然而在实际使用中,inurl 往往并不能如预期般获得想要的结果,原因如下:

  • Google 并不能很有效地去搜索 url 中协议的部分,比如 http://
  • 在实际情况中,url 通常会包含大量的特殊字符。为了在搜索的同时兼容这些特殊字符,搜索的结果就不会如预期那样精准;
  • 其他的高级操作符(比如:site, filetype 等)可以搜索 url 内特定的部分,在搜索中的效率也比 inurl 高的多。

所以 inurl 并不如 intitle 那样好用。但即便 inurl 或多或少有一些问题,inurl 在 Google Hacking 中也是不可或缺的。

和 intitle 相同,inurl 也有一个对应的高级操作符 allinurl。而且 allinurl 同样不能与别的高级操作符结合使用,所以如果想要去搜索 url 中多个关键字,最好使用多个 inurl 操作符。

· site ·

site 操作符可以在特定的网站中指定搜索内容,比如搜索 site:apple.com,返回的内容就只会是 www.apple.com 这个域名或者其子域名下的内容。

不过需要注意的是&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值