我发现使用python string split() function来处理这类事情很容易。在
编辑:处理新需求的大更新
一些简单的东西,比如:html = """
var id = \"5010\";
var id2 = \"8888\";
var idX = \"XoX\";
"""
varlist = {}
vars = html.split("var ")[1:] # get each var entry
for v in vars:
name = v.split("=")[0].strip() # first part is the var [name = "]
value = v.split("\"")[1] # second part is the value [ = "..."]
varlist[name] = value # store it for printing below
print("Varlist - " + str(varlist))
-
OUTPUT: Varlist - {'id': '5010', 'id2': '8888', 'idX': 'XoX'}
split()返回字符串列表,这些字符串在您搜索的部分周围分开。第二个参数表示最大拆分数。因此,通过对一个字符串进行拆分,将其限制为一个拆分,然后使用[0]或[1]元素,就可以分离输入以获得所需的数据。在
在上面,第一个拆分是在var上。这给出了一个列表,因为字符串在有var的地方被拆分,因此每个条目的第一部分是var名称(我们从一开始就扔掉垃圾)。在
然后,代码循环执行这些拆分,通过在=上拆分来获取var名称,得到[0]侧。接下来是var值,它总是包含在引号中,因此对"的拆分应该给出一个3项列表,[1]元素是var的值。在
如果您的值不总是用引号括起来,也许可以在;上拆分,等等。可以使用任何类型的保证模式。在