python包含6中内建的序列:列表、元组、字符串、Unicode字符串、buffer对象、xrange对象。序列的元素也可以是一个序列,这六个序列中列表是比较重要的一个,相比较于元组,我们可以修改列表,但是不能修改元组。 下标 列表的下标也是从0开始,但是我们能够从
python 列表list去重
一.{}.fromkeys(list).keys()
list2 = {}.fromkeys(list1).keys()
二.set
list2 = list(set(list1))
三.itertools.grouby
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)
for k, g in it:
print k
四,笨方法
ids = [1,2,3,3,4,2,3,4,5,6,1]列表 序列的通用操作包括: 索引(indexing),分片(slicing),加(adding),乘(multiplying) 一.列表索引: 通过下标编号访问数据: >>> a=['a','b','c','d','e','f'] >>> a[0] 'a' >>> a[3]
news_ids = []
for id in ids:
if id not in news_ids:
news_ids.append(id)
print news_ids
这四种都有个特点,去重后元素排序变了,效率 据说第一种比第二种快一点
五.索引再次排序 这种可以去重并且保持元素顺序
#要结果是[1, 4, 3, 2, 5, 6] 不要[1, 2, 3, 4, 5, 6]
ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(key=ids.index)
print news_ids #[1, 4, 3, 2, 5, 6]
六:Reduce
ids = [1,4,3,3,4,2,3,4,5,6,1]
func = lambda x,y:x if y in x else x + [y]
print reduce(func, [[], ] + ids)#[1, 4, 3, 2, 5, 6]