在处理数据的时候,经常需要判重,例如将几个集合set合并成一个集合。
法一:
最开始采取的方法是利用Python自带的数据结构set([]),然后采用集合并‘|’运算,得到最终的集合,这种方法比较简单大,但效率太低,耗时严重,如下:
vocabularySet=set([])
vocabularySet=vocabularySet|set(vocabularyDocument[classNumber]) # set 合并,耗时操作
法二:
在C++中,经常采用数据结构Map来Hash,于是查找Python中的Map(映射),发现Python有字典(Dictionary数据类型),这个映射Hash过程,可以用它来完成,效率提高不少,如下:
vocabularyHash={}