我還是不太懂你的意思, 不過我大概猜一下, 有任何猜錯再麻煩你跟我說。
我猜你要爬這種形式的 url:
-init-page-line
所以你有三個 list 可能長這樣:
self.lst[0] = ['init', 'a', 'b', 'end']
self.lst[1] = ['page', 'paragraph', 'row']
self.lst[2] = ['line', 'face', 'point']
然後你分別有 index 和 limit 來紀錄現在走到哪個位置和每個 lst 的最大 index:
self.index = [0, 0, 0] # in the begining
self.limit = [3, 2, 2]
然後你透過組合, 組出所有 url:
while self.index[0] <= self.limit[0]:
while self.index[1] <= self.limit[1]:
while self.index[2] <= self.limit[2]: # P.S. 你這裡是不是打錯了
name1 = self.lst[0][self.index[0]]
name2 = self.lst[1][self.index[1]]
name3 = self.lst[2][self.index[2]]
# get page "-name1-name2-name3" and download someting
# update self.index