在想去除list中的特定重复词时,比如我们想去掉下列list中的'a',通常想到的办法是这样的
words = ['a', 'a', 'c', 'b', 'c']
stopwords = ['a']
for word in words:
if word in stopwords:
words.remove(word)
然而,结果却是
诶,明明逻辑应该是对的,但我们并没有把'a'去除干净?
这是因为我们在第一次remove后,再进行for循环时发生了紊乱。这是一个非常容易进入的误区。
解决的办法是通过额外取用内存创建一个原始list的copy,这样我们在copy list上进行循环,而在原始list上进行删除操作,就再也不会触及陷阱了!
words = ['a', 'a', 'c', 'b', 'c']
stopwords = ['a']
for word in list(words):
if word in stopwords:
words.remove(word)
得到的结果