【语句】如何将列表拼接成字符串并截取20个字符后面的

base_info = "".join(tree.xpath('/html/head/script[4]/text()'))[20:]

以下是对这个语句的详细讲解:

tree.xpath('/html/head/script[4]/text()')部分:

  • tree:通常是一个已经构建好的 HTML 文档树对象,它是通过相关的 HTML 解析库(比如 lxml)对 HTML 文档进行解析后得到的。
  • /html/head/script[4]:这是一个 XPath 表达式。
    • /html 表示从文档根节点开始选择 <html> 元素。
    • /head 表示在 <html> 元素下选择 <head> 元素。
    • script[4] 表示在 <head> 元素下选择第 4 个 <script> 元素。
  • /text():表示选择该 <script> 元素中的文本内容。如果有多个文本节点,它会将这些文本节点的值都提取出来。

"".join(...)部分:

  • join 是 Python 字符串的一个方法,它将一个可迭代对象(这里是从 XPath 表达式得到的文本内容列表)中的元素拼接成一个字符串。如果没有匹配到 <script> 元素或者 <script> 元素没有文本内容,那么可迭代对象可能为空。

[20:]部分:

  • 这是 Python 中对字符串进行切片操作。它表示从字符串的第 20 个字符开始,一直到字符串的末尾,截取出来作为新的字符串。如果整个字符串的长度小于 20,那么得到的将是一个空字符串。
  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青龙摄影

你的鼓励是我创作的动力,支持下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值