- 博客(3)
- 收藏
- 关注
原创 python用src无法爬取全部图片的解决办法
python用src无法爬取全部图片的解决办法起源于我用get(‘src’)只能爬取网页起始的5张图片,剩下的返回None,当我调出完整的网页源代码后发现,原本的src=‘图片地址’,变成了data-ks-lazyload=‘图片地址’Elements页面处图片位置是src但查看完整网页源代码后就变成data-ks-lazyload原因是网页图片延迟加载(为减轻网页加载压力,鼠标下滑浏览后才加载后续图片)解决方法:加一步get(‘data-ks-lazyload’)import reques
2020-11-16 12:12:24 2380 1
原创 python爬取天猫搜索页面产品标题
python爬取天猫搜索页面产品标题上一篇我用白痴方法提取代码中的文本,real冗长,今天看了个大佬视频,get到了text的用法,提取文字超方便!想要爬取的信息:天猫搜索页面的产品标题为了方便演示,这里只爬取搜索结果的第一页,且无储存上代码import requestsfrom bs4 import BeautifulSoupurl='https://list.tmall.com/search_product.htm?q=%B6%B9%BD%AC%B7%DB+%CE%DE%CC%C7&am
2020-11-14 18:42:26 586
原创 python爬取BT之家特定频道前5页电影信息(小白操作)
python爬取BT之家特定频道前5页电影信息(小白操作)想要爬的网页如下,希望得到BT之家恐怖频道的电影信息,并存档xls代码如下import requests,openpyxlwb=openpyxl.Workbook() #创建工作薄sheet=wb.active #获取工作薄的活动表sheet.title='horror' #工作表重命名sheet['A1'] ='电影信息' #加表头,给A1单元格赋值from bs4 import BeautifulSoup#
2020-11-11 20:51:08 4143 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人