抓取微信里面小程序里的文字信息--yuke

最新推荐文章于 2024-06-01 20:15:38 发布

小主早安

最新推荐文章于 2024-06-01 20:15:38 发布

阅读量1.4k

点赞数

分类专栏： scrapy框架

本文链接：https://blog.csdn.net/xiaoxiamimm/article/details/112399921

版权

scrapy框架专栏收录该内容

8 篇文章 0 订阅

订阅专栏

import scrapy
import json

class QiubaiSpider(scrapy.Spider):
    name = 'qiubai'
    start_urls = ['https://mp.weixin.qq.com/s/n7E2PCcXppbLMXtR_Um-FA']

    def parse(self, response):
        div_list = response.xpath(
            '//*[@id="js_content"]/section[2]/section[1]/section/section[2]/section/p')

        id_list = []
        for div in div_list:
            div_list2 = div.xpath('./span[1]/text()').extract_first()
            if div_list2 != None:
                print(div_list2)
                id_list.append(div_list2)
                fp = open('./语文重点.txt', 'w', encoding='utf-8')
                json.dump(id_list, fp, ensure_ascii=False)

在这里插入图片描述

scrapy crawl qiubai

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小主早安

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
抓取微信里面小程序里的文字信息--yuke

import scrapyimport jsonclass QiubaiSpider(scrapy.Spider): name = 'qiubai' start_urls = ['https://mp.weixin.qq.com/s/n7E2PCcXppbLMXtR_Um-FA'] def parse(self, response): div_list = response.xpath( '//*[@id="js_content"]/s
复制链接

扫一扫