世上男女资源千千万,总有一款适合你。
互联网的发展迅速,其数据量越来越大,如何准确找到自己所需的内容成为关键。个人对于搜索流程的总结,大概如下:
明确需求->引擎选择->搜索表达式->选择结果
一、明确需求
先明确自己的需求。当有了需求后,不妨再细想一下,你真正需要的是什么,是关于Python的书籍,论坛,或者是相关大牛等。下一步直接选择相应的搜索引擎,结果可靠性会高很多。
二、引擎选择
一般来说搜索引擎对于结果的影响最大。例如常用的「百度」「谷歌」等都是综合性搜索引擎,啥都能搜,但精准度不高。但细分的搜索引擎,例如「百度知道」,可以专门搜索百度的问答。那这些细分的搜索引擎怎么找呢?这可能需要平时慢慢收集,或者求助于专业圈子里的专业人士。专业的事让专业的人解决,是很有道理的。
简介 | 网址 | |
---|---|---|
谷歌 | 综合搜索 | https://www.google.com/ |
百度 | 综合搜索 | https://www.baidu.com/ |
Github | 官方搜索教程 | https://github.com/ |
GIthub Trend | 搜 Github 最热项目 | https://github.com/trending |
鸠摩搜书 | 电子书搜索 | https://www.jiumodiary.com/ |
…… | 优秀网站,利用综合搜索引擎 | 根据自己需求搜索收集 |
三、搜索表达式
说到底,搜索引擎都是基于匹配关键字返回结果的。但简单的输入一两个关键字直接搜索,是很低效的。掌握一些通用的搜索表达式,会让搜索命中率提升数倍。
简介 | 实例 | |
---|---|---|
空格 | 同 AND,结果包含所有关键词,搜索引擎默认方式 | Python 爬虫 |
| | 同 OR,结果包含一个或多个关键词 | 减肥|爬虫 |
- | 屏蔽-后的关键词 | Python -爬虫 |
“” | 结果精确匹配 | “Python爬虫” |
* | 表示不确定的字母或词,用于英文较好 | Py*n |
《》 | 查询相关作品 | 《Python爬虫》 |
site: | 搜索指定网站 | Python爬虫 site:github.com |
filetype: | 搜索指定格式,pdf,dos,txt等 | Python爬虫 filetype:pdf |
inurl: | URL 地址里包含关键词 | inurl:Python |
intitle: | 标题里包含关键词 | intitle:Python爬虫 |
intext: | 正文中包含关键词 | intext:Python爬虫 |
使用多个表达式混合搜索时,之间最好「空格」隔开,以满足搜索引擎的默认搜索方式。例:
intitle:“Python爬虫” -培训 filetype:pdf
各家的搜索引擎工作细节都不太相同,关键字的处理也会有些差异。
四、选择结果
返回搜索结果后,大多可以先筛选一下。就像淘宝里,按价格递增或递减,像一些问答,按点赞数递减排列等,或者筛选某一时间范围内。此时返回的结果大多都切合最初的需求了,终于可以选择结果了。像谷歌返回搜索结果后,点击网页不在新标签页打开,按住Ctrl再点击。
推荐阅读:
轻松提高搜索能力-实用网站合集