在KNN算法中有对距离进行排序,这里用到
sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
其中classCount是字典,其包括了标签与计数,即classcount={ 'a': 5, 'b': 3, 'c': 6 }
operator.itemgetter()函数
operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。
a = [1, 2, 3]
>>> b=operator.itemgetter(1) # 定义函数b,获取对象的第1个域的值
>>> b(a)
2
>>> b=operator.itemgetter(1,0) # 定义函数b,获取对象的第1个域和第0个的值
>>> b(a)
(2, 1)
注意: operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。
sorted(iterable[, cmp[, key[, reverse]]])函数
Python内置的排序函数sorted可以对list或者iterator进行排序。
参数解释:
(1)iterable指定要排序的list或者iterable;
(2)cmp为函数,指定排序时进行比较的函数,可以指定一个函数或者lambda函数;如:
students为类对象的list,没个成员有三个域,用sorted进行比较时可以自己定cmp函数,例如这里要通过比较第三个数据成员来排序,代码可以这样写:
students = [('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]
sorted(students, key=lambda student : student[2])
(3)key为函数,指定取待排序元素的哪一项进行排序,函数用上面的例子来说明;
(4)reverse参数就不用多说了,是一个bool变量,表示升序还是降序排列,默认为false(升序排列),定义为True时将按降序排列。
整理
有了上面的operator.itemgetter函数,也可以用该函数来实现,例如要通过student的第三个域排序,可以这么写:
sorted(students, key=operator.itemgetter(2))
sorted函数也可以进行多级排序,例如要即先根据第二个域排序,再根据第三个域排序。
可以这么写:
sorted(students, key=operator.itemgetter(1,2))
items()和iteritems()
items()返回的是列表对象,而iteritems()返回的是iterator对象。例如:
print dic.items() #[('a', 'hello'), ('c', 'you'), ('b', 'how')]
print dic.iteritems() #<dictionary-itemiterator object at 0x020E9A50>
iteriitems和items在sorted函数里面的应用区别:
iteritems()返回的是一个能遍历所有键值对的生成器。
items()返回的是整个列表中的键值对的拷贝,在你的dict比较大的情况下会消耗大量内存。
结果一致。