今天利用python爬电影的时候发现了一个问题,先贴代码
browser.get('http://dianying.2345.com/list/jingdian------.html')
html = browser.page_source
doc = pq(html)
items = doc('#contentList > ul > li').items()
list1 = []
for item in items:
href = item.find('.pic > a').attr('href')
list1.append(href)
print(list1)
结果打印的结果中竟然出现了多个列表,而我们只需要最后的一个完整列表
出现原因:print放在for循环里面导致多次打印
解决办法:把print(list1) 向前缩进至和for item in items相同的位置