我们在使用百度搜索资源的时候,可能输入的关键字不论怎么变化,查询前面几条结果都是广告,即便是我们输入"如何去除百度广告":
显示的第一条也还是广告…
那么有没有办法去掉百度的广告,让搜索结果更精准一点呢?实际上百度有一套搜索技巧可以去掉查询出来的广告并且实现精准搜索。
百度搜索技巧
- intitle
使用intitle可以让搜索结果必须包含搜索栏中输入的关键字,以过滤广告。
in:在…里面 title: 标题
使用案例:
输入:
intitle:如何去除广告
输出:
可以看到,结果中那些标记为广告的链接都没有了。
- intext
使用方法与intitle类似,可将关键词筛选至在正文中出现。
in:在…里面 text:正文
- inurl
用于限定搜索的网站。
in:在…里面 url:Uniform Resource locator(可粗略理解为网址的缩写)
使用案例:
输入:
intitle:长沙 inurl:gov
输出:
查询出来的内容都是长沙的政务网站。
常见的网站缩写后缀:
- 文件类型限定:filetype:xxx
用于将搜索出的文件格式限制为xxx格式
file:文件 type:类型
使用案例:
输入:
新媒体发展报告 filetype:pdf
输出:
常用的限制格式名称及缩写:
- 搜索时间限定
用于限定搜索的时间范围
关键词+空格+时间范围
时间范围用两个点表示,如:
2018年到2019年 写作:2018…2019
使用案例:
输入:
intitle:电商发展2015…2020
输出:
搜索时间范围在2015-2020年的“电商发展内容”。
开源的搜索工具
知道了这些搜索的规则,但如果老是需要输入这些关键字也挺麻烦的,好在有人利用搜索规则写了一个简单的搜索工具。
search_tools
根据搜索引擎的搜索规则,写了个前端页面,避免老是输入搜索规则
搜索技巧
- 排除关键词(减号+关键词) 比如说:搜锤子而不是锤子手机,即为-手机
- 精确搜索(给关键词加引号) 比如说:想搜小苹果,而不想是苹果,就“小苹果”
- 指定网站内搜索(site:域名 关键词) 比如说在知乎里搜关于小苹果的内容,即为:site:zhihu.com 小苹果 这个方法用于一些搜索引擎特别垃圾的资料网站 比如说中国裁判文书网
- 指定文件格式(filetype:文件格式 关键词) 比如说filetype:pdf 张文显《法理学》 包括doc,ppt,avi等格式
- 指定标题搜索(intitle:关键词) 搜索的内容必须出现在标题里 比如说:intitle:小苹果 那搜索出来的网页标题就都包括小苹果 不然就会出现一些内容才会出现小苹果的网页 信息检索就很费劲
- intext:是指如果输入intext:小苹果,那搜索出来的文章里面就必须有小苹果的内容
- allintext: 是指搜索出来的内容必须有包括 小苹果 大苹果 红苹果 所有的内容
- 结果包含某个url
注意事项
- 所有的冒号都是半角,也就是英文的冒号,而不是中文的冒号
- 空格很重要,关键词之间要有空格
- 提取关键词很重要(可以提高搜索效率)
- 在以上8种不同的方法之间加上“空格”,即可组合搜索,交集搜索。
工具页面
开源地址
GitHub地址:search_tool
Gitee地址:search_tool
往期文章:
- Python爬取自己CSDN后台原始markdown数据
- 对外API接口的安全性设计及鉴权方式
- 基于FreeMarker的自定义代码生成器
- vue实现markdown编辑器以及md文件转化成html
- 使用Java生成思维导图
- Java实现简易画图板
关注下方公众号,该公众号将不定期分享一些小demo、小项目以及学习心得。