自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python 读取Excel表格中的关键字进行批量爬取

需求:编写Python爬虫时,根据excel里的数据进行爬取:首先我们应该要导入openpyxl 但是我最近导入了几个pycharm里面没有的库必须要用pip才能导入的 然后导入还不能用的 反正一大堆问题所以我推荐 最好在如图中使用pip导入库我这就是导入成功了然后我们就可以导入openpyxl 库了 但是我们使用的并不是这个库而是openpyxl 这个库下面的load_workbook如图这是我自己写的 一小段代码如下:from openpyxl import load

2020-12-04 15:03:58 2115

原创 Python无头浏览器 使用 根据关键词爬取百度资讯

Python 利用无头根据关键字爬取百度资讯代码如下需要导入的库(因为后面都自己写了 备注 怕自己过段时间看不懂 所以截屏都没有备注 怕大家看见我的备注 误导 )因为百度资讯翻页 是第1页 为0 第二页为10在for循环下面 设置一下时间(网速快的话 而且比较稳定 可以不用设置 时间长短自己设置就好了)然后再根据源代码写的正则(因为是小白 自学的 目前只会正则 不会xpath)最后再使用一个for循环将爬取的依次输出 顺便再去除一些不需要的符号pycharm运行的结果

2020-12-04 14:22:49 392

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除