文兄兄兄-CSDN博客

原创 python用src无法爬取全部图片的解决办法

python用src无法爬取全部图片的解决办法起源于我用get(‘src’)只能爬取网页起始的5张图片，剩下的返回None，当我调出完整的网页源代码后发现，原本的src=‘图片地址’，变成了data-ks-lazyload=‘图片地址’Elements页面处图片位置是src但查看完整网页源代码后就变成data-ks-lazyload原因是网页图片延迟加载（为减轻网页加载压力，鼠标下滑浏览后才加载后续图片）解决方法：加一步get(‘data-ks-lazyload’)import reques

2020-11-16 12:12:24 2380 1

原创 python爬取天猫搜索页面产品标题

python爬取天猫搜索页面产品标题上一篇我用白痴方法提取代码中的文本，real冗长，今天看了个大佬视频，get到了text的用法，提取文字超方便！想要爬取的信息：天猫搜索页面的产品标题为了方便演示，这里只爬取搜索结果的第一页，且无储存上代码import requestsfrom bs4 import BeautifulSoupurl='https://list.tmall.com/search_product.htm?q=%B6%B9%BD%AC%B7%DB+%CE%DE%CC%C7&am

2020-11-14 18:42:26 586

原创 python爬取BT之家特定频道前5页电影信息（小白操作）

python爬取BT之家特定频道前5页电影信息（小白操作）想要爬的网页如下，希望得到BT之家恐怖频道的电影信息，并存档xls代码如下import requests,openpyxlwb=openpyxl.Workbook() #创建工作薄sheet=wb.active #获取工作薄的活动表sheet.title='horror' #工作表重命名sheet['A1'] ='电影信息' #加表头，给A1单元格赋值from bs4 import BeautifulSoup#

2020-11-11 20:51:08 4143 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人