Python爬虫
bensam
这个作者很懒,什么都没留下…
展开
-
下载图片代码片段:
1、# -*- coding:UTF-8 -*-import requests, json, time, sysfrom contextlib import closingclass get_photos(object): def __init__(self): self.photos_id = [] self.download_server = 'https://unsplash.com/photos/xxx/download?force=trues转载 2020-10-18 07:33:46 · 146 阅读 · 0 评论 -
request+BeautifulSoup:下载《笔趣看》网小说《第九特区》
# -*- coding:UTF-8 -*-from bs4 import BeautifulSoupimport requests, sysimport time"""类说明:下载《笔趣看》网小说《第九特区》Parameters: 无Returns: 无Modify: 2020-10-16"""class downloader(object): def __init__(self): #self.server = 'http://ww.原创 2020-10-16 12:07:33 · 2050 阅读 · 0 评论 -
Python爬虫:urllib.request库下载图片
1、说明: 使用urllib.request库请求汽车之家网页,返回报文用BeautifulSoup解析后提取出图片的下载链接,再使用urllib.request库下载图片到指定目录2、代码:'''在本python文件所在的目录下新建文件夹“mrsoft”,在“mrsoft”下新建四个文件夹:车身外观、车厢座椅、其他细节、中控方向盘。在汽车之家网站上下载图片分别放入以上四个文件夹里,并将图片文件名编好号不足:比方说“车厢座椅”有103张图片,本程序只下载了第一页的62张'...原创 2020-10-15 11:58:28 · 1995 阅读 · 0 评论 -
Python爬虫:requests库学习笔记
一、导入常用库:import requests # 网络请求模块from bs4 import BeautifulSoup # HTML代码解析模块import json # json数据解析模块import re # 正则表达式模块from lxml import html #Xpath表达式二、随机User-Aget(反爬手段之一,选用):from fake_useragent impo原创 2020-10-15 11:12:39 · 537 阅读 · 0 评论