简单学会!xpath的使用以及获取图片以及保存至本地

xpath是啥,其全称为XML Path Language,即XML路径语言。这是在XML文档中查找信息的语言,可以用来在获取的页面源代码中提取页面信息。我觉得用起来也很简洁,它返回的对象是一个列表。这是等下要用到的库,requests和urllib用于请求并返回页面信息,lxml库xpath做解析用,csv用来保存csv文件,time是为了后面的缓冲,以免访问太过于频繁。如果没有安装的话,在控制台处pip install 就可以了。定义保存的函数这次的内容包括标题、作者、描述,所以定义的函数的参
摘要由CSDN通过智能技术生成

前言

xpath是啥,其全称为XML Path Language,即XML路径语言。这是在XML文档中查找信息的语言,可以用来在获取的页面源代码中提取页面信息。我觉得用起来也很简洁,它返回的对象是一个列表。

准备

这是等下要用到的库,requests和urllib用于请求并返回页面信息,lxml库xpath做解析用,csv用来保存csv文件,time是为了后面的缓冲,以免访问太过于频繁。如果没有安装的话,在控制台处pip install 就可以了。

import requests 
from lxml import etree
import csv
import time
import urllib.request

定义保存的函数

这次的内容包括标题、作者、描述,所以定义的函数的参数就如图示,值得注意的是,这里用utf-8-sig写入csv文件,我用utf-8写入时出现乱码,所以加了一个-sig,sig是标签的意思,因为有可能python写入csv时杂夹一些标签,这样就容易出现乱码,然后用遍历,一行一行的写入。

def save(title,author,describe):
    with open("宠物领养信息.csv",'a',encoding='utf-8-sig',newline = "") as f:
        w=csv.writer(f)
        for i in range(0,len(title)):
            w.writerow([title[i],author[i],descr
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值