写在前面
本文从百度、360两种搜索引擎介绍关键字的提交爬取信息,在引用例的基础上做了优化,可以自主输入关键字,打印输出提交关键词后的查找内容的字符串长度以及相关的URL。
一.爬取原页面
以关键词为python为例。
1.百度页面如下
2.360页面如下
小声BB:通过上面对比发现同样是卖课,看来这几个机构给的钱是不一样的呀,某度还是把自己的平台放在了第一位。
二.爬取原理分析
首先我以查找python为例向大家展示在百度和360搜索页面中URL的结果。
1.百度
https://www.baidu.com/s?wd=python&tn=78040160_5_pg&ch=8
2.360
https://www.so.com/s?q=python
通过上述实践我们可以发现搜索引擎是有其关键词的提交接口的。
百度的关键词接口:
https://www.baidu.com/s?wd=keyword
360的关键词接口:
https://www.so.com/s?q=keywo