PJzhang:搜索引擎高级语法与渗透测试

猫宁!!!

参考链接:

https://www.freebuf.com/articles/network/169601.html

https://www.jianshu.com/p/f8062e2cc1d7

 

百度搜索高级语法很多,但在渗透测试中有效的语法也就10多个,它们通过自由组合,帮我们实现高效搜索目标。

相比语法,语法的应用场景更为关键,exp-db中的google hacking提供了大量的参考场景,给我们提供了多种多样的弹药。

https://www.exploit-db.com/google-hacking-database

 

能用百度演示,就不用了谷歌了,原因结尾说,不过别误解,和GFW没半毛钱关系。

 

双引号 "" ,英文双引号,锁定关键词

我试了一下百度,"百度网盘"加引号与不加引号搜索结果区别不大,借助谷歌。

不加引号,你看网页说明出,还有 百度 这个结果标红,搜索结果1.36亿条。

加引号,截图之外的网页说明处也都是标红 百度网盘 这个关键词,更精准,搜索结果3800万条。

 

加号,让搜索中尽可能出现加号之后的关键词,这个功能在谷歌和百度中都比较鸡肋。星号,英文的小点以及“~”用处同样不明显。搜索引擎高级语法本身也是区分可用性程度的。

百度 +网盘,百度 网盘,没有什么大的差别,虽然搜索结果上 百度 网盘 的结果是前者的2倍,但对用户没产生明显影响。

 

减号,让搜索中尽可能不出现减号之后的关键词

搜索百度会有 百度一下,结果1亿条。

采用减号,百度 -一下,可见效果还是比较显著的,截图之外也如此,结果也是1580万条,较少。

 

site语法,site:qq.com,可以看到很多腾讯公司的子域名,有助于腾讯公司域名资产的收集,对于其他域名是同样道理。

 

filetype语法,filetype:pdf,搜索出来的几乎全都是pdf文档,pdf也可以替代,例如ppt/doc/xls等文档类型均可,如果使用谷歌php/asp/action/aspx这种后缀也可以搜索。

 

cache语法,cache:www.pku.edu.cn,可以找到北京大学主页的缓存,但是需要用谷歌,百度不支持,缓存的是2天前的。

 

info语法,可以显示在标题,url,网页说明中的关键词信息,info:pku.edu.cn,可以看到很多的邮箱,子域名以及外链的信息,可以和别的语法先后使用,获取更多信息。

 

phonebook语法,phonebook:russia,可以显示俄罗斯的开源个人电话信息查询站点,可以认为是开源社工库,当然USA/UK等国家的也都可以找到。

 

 

 link,define,inanchor,datarange,related,music,movie,wheather等语法处境和加号类似,应用场景不是很多,可用性较差,但并不代表它们是没用的,只是在渗透测试信息收集中作用不明显。

 

接下来介绍的是很重要的6个语法。

intitle语法,intitle:后台,这个时候会发现能看到很多的后台站点出现,而在站点标题无疑都有后台这个字眼,当然换成别的词汇或者英文都是可以的。

allintitle语法,allintitle:后台 登录,标题中尽可能显示后台和登录两个关键词。

intitle:后台 intitle:登录 ,可以搜到更多结果,而且在中文字符上百度远好过谷歌,谷歌对于显示的页数有限制,只能查看20个页面的结果。

intitle:后台 登录,则表示标题一定要有后台,但是 登录 可以出现在网页说明中。

不过实际上,搜索语法与最终显示结果并不是绝对的,只能说不同的语法更倾向于某种搜索结果。

能用intitle最好不选用allintitle。

 intext语法,intext:百度,因为百度不明显,这个用谷歌展示,在网页说明中会出现 百度 这个关键词的字眼。

allintext语法,allintext:百度 周鸿祎,在网页说明中有百度 周鸿祎 两个关键词同时出现。allintext:周鸿祎 百度,两个关键词调转位置,结果基本一样。

inurl语法,inurl:admin,在网页URL中一定含有admin这个关键词,administrator也是包含admin的,一般这样的站点多是后台。

allinurl语法,allinurl:admin login,在URL中含有admin,login,百度表现不明显,用谷歌展示出来。

 现在说一些组合语法

intitle:index.of,其中的点表示一个单字符,index.of出现在标题中,打开第一个链接,这种类型目录可以发现很多。

 intext:"the WordPress" inurl:wp-config ext:txt,网页说明精准含有the WordPress这个关键词,url中含有wp-config,链接的文件扩展名是txt文件,包含对方的配置文件信息。

 intitle: "Index of" intext:log,在网页标题中精准含有Index of,网页说明中含有log关键词,获取一些日志类文件。

 site:com inurl:jboss filetype:log -github.com,站点一定是com的,url中含有jboss,文件类型是log,并且不能是来自github。

filetype:mdb inurl:com,文件类型是mdb的数据库文件,url中含有com,可以获取大量的数据库文件。

这里就用5个例子说明一下,场景一方面是参考他人案例,另外自己也需要根据实践,采用适合的组合拳。

 

搜索引擎高级语法需要掌握,搜索引擎直接提供的高级搜索框也应该熟悉里面各个选项的用途,在实际使用中也许更高效。

这是谷歌的高级搜索框,还有一大堆的解释说明,比较贴心。

还有搜索框工具,可以快速调节时间还有结果类型,verbatim是精准匹配的意思。

这是百度的高级搜索框,相比谷歌少了语言和地区选项,其他基本一样,倒是显得简约不少。

百度的搜索框工具倒是更齐全,除了时间还有文件类型,以及站点锁定功能,即使日常用起来也可以带来不少便利。

 

谷歌作为一个全球性搜索引擎,在爬取全球各国各地区网页上不遗余力,百度主要够专注于中国市场,在中文搜索上还是要略胜一筹,百度自建的这个生态可谓相当重要,例如百度百科,百度知道,百度文档等,因此在搜索国内站点时,谷歌百度结合使用会更好,而且谷歌对于频繁访问的行为还进行人机识别,但是国内访问百度还没有遇到过。

此外在国内,除去百度其他搜索也有自己的特色。

搜狗搜索,其中的搜狗微信和搜狗知乎是百度所欠缺的,也是搜狗独有特色,目前微信APP搜索功能显示结果很多就是搜狗的结果。

https://www.sogou.com/

微软必应搜索,目前国内的搜狗英文还有360英文搜索采用的都是必应提供技术支持,国外的雅虎搜索,除去雅虎日本外,也是完全由必应提供搜索技术支撑,必应学术在搜索英文文献上比百度好很多,可以一定程度替代谷歌。即使在国内如果搜索英文技术文章,使用必应国际版,也是很好的。

https://cn.bing.com

国内还有的神马搜索,只做移动端;360搜索,靠360浏览器、360导航、360安全卫士引流量;中国搜索,号称搜索引擎国家队。这几个很多搜索引擎高级语法都不怎么支持。

 

选择百度来演示,并不是说百度比谷歌好,而是为了说百度有自己天然的本土优势,对中国站点信息收集,绝对不能轻视。

目前掌握搜索引擎核心技术的国家有4个,中国,美国,俄罗斯,韩国。

俄罗斯的yandex是独联体国家市场份额最大的一家,如同百度在中国地位,在site收集国内站点子域名的时候,可以给你带来意想不到的收获,不过也有人机识别认证,如果收集俄语信息,yandex是你绕不开的一个,此外俄罗斯的mail.ru搜索也占据较大市场,主营社交软件、邮箱和视频业务,主要做俄语搜索。

yandex英文版

mail.ru俄语版

https://mail.ru/

韩国人的第一大搜索引擎同样不是谷歌,而是Naver搜索,而且该公司是著名社交软件Line的开发者,朝鲜语的搜索领域也是不可或缺的。

 

国外的一个号称隐私保护搜索站点DuckDuckGo搜索千万不要错过,尤其是对于注重隐私的人,每次访问这个网站就相当于第一次访问,它们的盈利手段是基于关键词来展示广告,而不是跟踪分析你的喜好来展现。

DuckDuckGo,打开直接显示中文,对于隐私保护,我有点质疑。

https://duckduckgo.com

 

美国人的一个手册,google hacking:渗透测试者的利剑,对谷歌搜索语法进行了详尽分析,京东有售中文翻译版。

这里有一个PPT版的,而且是书的作者早年做的。

http://www.mrjoeyjohnson.com/Google.Hacking.Filters.pdf

 

防止信息泄露和服务器入侵的措施:(来自freebuf-K0rz3n)

1.检查所有的文档能否被Google搜索到,避免敏感文件能出现在公众的视野中

2.选择一个强大的自动化工具来扫描你网站上是否有信息的泄露

3.不要使用默认的登录入口,以防止登录入口被hacker猜解

4.关闭数据库的远程管理工具

5.删除明显的显示软件版本的信息

6.配置服务器只能下载特定的文件类型(白名单比黑名单要简单有效得多)

7.正确的配置你的服务器,不要抱有侥幸心理,任何的松懈带来的灾难是巨大的

8.不要把源码的备份放在未经授权就能访问的地方,并且及时删除网站上的无用的备份文件

9.不要使用弱密码,防止攻击者轻易攻破后台

10.登录请加上强度相对较高的验证手段,防止攻击者采用爆破的手段

11.关闭服务器不必要的端口

12.请不要使用网站上的任何信息作为密码,否则都属于容易爆破的类型

13.备份的源代码请经过专业的混淆,防止被下载之后轻易读取到内容

14.及时更新服务器的系统,修复潜在的漏洞

15.安装正规的安全防护软件

 

破除一个误解,千万不要以为常规搜索引擎就可以覆盖大部分,不是如此,淘宝,京东,亚马逊,wikihow,以及一些垂直的专业类站点都是很重要的信息获取途径,现在这个时代信息很多,这也造成了更多的信息鸿沟和信息壁垒,人与人之间的信息不对等反而愈发扩大,如何高效获取有效且专业及时的信息,显得尤为必要。

 

转载于:https://www.cnblogs.com/landesk/p/10903671.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值