获取script内html元素,Python从<script>html标记内部获取数据值

我发现使用python string split() function来处理这类事情很容易。在

编辑:处理新需求的大更新

一些简单的东西,比如:html = """

var id = \"5010\";

var id2 = \"8888\";

var idX = \"XoX\";

"""

varlist = {}

vars = html.split("var ")[1:] # get each var entry

for v in vars:

name = v.split("=")[0].strip() # first part is the var [name = "]

value = v.split("\"")[1] # second part is the value [ = "..."]

varlist[name] = value # store it for printing below

print("Varlist - " + str(varlist))

-

OUTPUT: Varlist - {'id': '5010', 'id2': '8888', 'idX': 'XoX'}

split()返回字符串列表,这些字符串在您搜索的部分周围分开。第二个参数表示最大拆分数。因此,通过对一个字符串进行拆分,将其限制为一个拆分,然后使用[0]或[1]元素,就可以分离输入以获得所需的数据。在

在上面,第一个拆分是在var上。这给出了一个列表,因为字符串在有var的地方被拆分,因此每个条目的第一部分是var名称(我们从一开始就扔掉垃圾)。在

然后,代码循环执行这些拆分,通过在=上拆分来获取var名称,得到[0]侧。接下来是var值,它总是包含在引号中,因此对"的拆分应该给出一个3项列表,[1]元素是var的值。在

如果您的值不总是用引号括起来,也许可以在;上拆分,等等。可以使用任何类型的保证模式。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值