自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 python用src无法爬取全部图片的解决办法

python用src无法爬取全部图片的解决办法起源于我用get(‘src’)只能爬取网页起始的5张图片,剩下的返回None,当我调出完整的网页源代码后发现,原本的src=‘图片地址’,变成了data-ks-lazyload=‘图片地址’Elements页面处图片位置是src但查看完整网页源代码后就变成data-ks-lazyload原因是网页图片延迟加载(为减轻网页加载压力,鼠标下滑浏览后才加载后续图片)解决方法:加一步get(‘data-ks-lazyload’)import reques

2020-11-16 12:12:24 2380 1

原创 python爬取天猫搜索页面产品标题

python爬取天猫搜索页面产品标题上一篇我用白痴方法提取代码中的文本,real冗长,今天看了个大佬视频,get到了text的用法,提取文字超方便!想要爬取的信息:天猫搜索页面的产品标题为了方便演示,这里只爬取搜索结果的第一页,且无储存上代码import requestsfrom bs4 import BeautifulSoupurl='https://list.tmall.com/search_product.htm?q=%B6%B9%BD%AC%B7%DB+%CE%DE%CC%C7&am

2020-11-14 18:42:26 586

原创 python爬取BT之家特定频道前5页电影信息(小白操作)

python爬取BT之家特定频道前5页电影信息(小白操作)想要爬的网页如下,希望得到BT之家恐怖频道的电影信息,并存档xls代码如下import requests,openpyxlwb=openpyxl.Workbook() #创建工作薄sheet=wb.active #获取工作薄的活动表sheet.title='horror' #工作表重命名sheet['A1'] ='电影信息' #加表头,给A1单元格赋值from bs4 import BeautifulSoup#

2020-11-11 20:51:08 4143 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除