前言
现在在百度上面搜索一个关键词,最前面的几个搜索结果都是广告,比如你搜索一个Python,前面几个都是百度竞价的Python培训机构。
既然是净化,广告什么的当然要通通剔除啦。。。
基本环境配置
Python版本:3.5.4
相关模块:
requests模块、bs4模块、win_unicode_console模块、PyQt5模块以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
主要思路
利用Python处理百度搜索关键字后返回的页面,提取其中的有效信息。
使用方式
(1)直接运行
功能:
在cmd窗口运行BaiduSearch_Spider.py文件后,根据提示输入相关信息后将得到的有效信息保存到results.txt文件中。
若需其他功能请自行修改源代码。
运行示例如下图所示:
结果:
(2)作为模块导入
使用示例如下图所示:
运行以及结果图:
返回的数据格式为:
简单实例:
功能:
(1)在cmd窗口中运行并展示获得的有效信息;
(2)根据有效信息选择想要了解的链接后将该链接网站在PyQt制作的简易Demo中显示。
结果图:
细心的小伙伴可能会发现:
这里不支持播放这种视频,因为我没配置,官网有配置教程,全英文实在懒得看,如果需要深入了解的小伙伴可以自己去看一下文档。