python爬取京东手机配置信息（正则）

最新推荐文章于 2021-01-29 23:52:23 发布

很不简单

最新推荐文章于 2021-01-29 23:52:23 发布

阅读量480

点赞数 1

分类专栏： python 文章标签：爬虫

本文链接：https://blog.csdn.net/qq_41960265/article/details/92766873

版权

正则

import requests
import re
from bs4 import BeautifulSoup
import time

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'}


def main():
    url='https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&wq=%E6%89%8B%E6%9C%BA&pvid=6d9b66b19bd14681a382b642822d3685'
    resl = requests.get(url, headers=headers)
    if resl.status_code == 200:
        resl.encoding = 'utf-8'
        txt = resl.text

        txt = re.findall(r'<div class="p-img">\s+?<a(.*?)></a>', txt, re.S)
        for txt1 in txt:
            urls = re.findall(r'//.+?html', txt1, re.S)
            urls = 'http:' + urls[0]
            info = requests.get(urls, headers=headers)
            info = info.text
            pinfo &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

很不简单

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬取京东手机配置信息（正则）

正则import requestsimport refrom bs4 import BeautifulSoupimport timeheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 ...
复制链接

扫一扫