京东手机信息爬取(全部手机)

本文介绍了一个使用Python内置模块urllib编写的单线程爬虫,旨在熟悉urllib库的常见函数,如urllib.build_opener()和urllib.request.urlopen()等。爬虫主要任务是抓取京东手机页面的信息,通过random.uniform()调整请求频率,同时能够保存图片链接。作者提醒该爬虫仅供学习参考,不适用于商业目的,并提供了多线程爬虫的参考资料。
摘要由CSDN通过智能技术生成

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

仅学习参考,不可用于商业用途

version_0

说明:单线程爬虫,使用模块为python自带模块,包括urllib,json等

   写这个爬虫是为了熟悉urllib的基本使用,包括常用函数.urllib.build_opener()、urllib.parse.urljoin、urllib.parse.quote、urllib.request.urlopen

   urllib.request.install_opener()、http.cookiejar、urllib.request.HTTPHandler()、urllib.request.HTTPCookiesProcessor()

   请求频率通过random.uniform(),随机选取

   本爬虫目前只支持获取手机页面的信息。

   所有的图片信息,以链接方式保存。可以使用urllib.request.urlretrieve()下载。

   若要构造多线程爬虫,请参考:https://www.cnblogs.com/nuochengze/p/12861358.html

效果预览:

  

源码如下:

from urllib import request
from urllib import parse
from urllib import error
from http import cookiejar
import re
from pprint import pprint
import time
import random
import json


class JdPhoneInfo(object):
    def __init__(self,key_word):
        self.key_word = key_word

    def get_url(self,key_word,page_num
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值