scrapy 提取XML文档

最新推荐文章于 2022-04-07 11:01:00 发布

weixin_30321709

最新推荐文章于 2022-04-07 11:01:00 发布

阅读量283

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/louzi/p/10944134.html

版权

import requests
import scrapy

url = 'http://xml文件的地址'
# 获取 xml 文件
res = requests.get(url)
# 替换，就是这么暴力
text = res.text.replace('<![CDATA[', '').replace(']]>', '')
# 创建一个 Selector 类的实例
sel = scrapy.Selector(text=text)
# 使用 xpath 选择器
year_list = sel.xpath('//year/text()').extract()

转载于:https://www.cnblogs.com/louzi/p/10944134.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30321709

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
scrapy 提取XML文档

import requestsimport scrapyurl = 'http://xml文件的地址'# 获取 xml 文件res = requests.get(url)# 替换，就是这么暴力text = res.text.replace('<![CDATA[', '').replace(']]>', '')# 创建一个 Selector 类的实例sel = scrapy.Sele...
复制链接

扫一扫