Beginning Python Chapter7

最新推荐文章于 2016-02-06 09:31:33 发布

kingskyarray

最新推荐文章于 2016-02-06 09:31:33 发布

阅读量293

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/kingskyarray/article/details/50462529

版权

Python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

当分割多行文本的字符串时可以使用splitlines()函数
任何序列或可迭代的对象都可以通过一个简单的赋值操作来分解为单独的变量，即序列可以赋值给等长的变量，如果数量不匹配将得到一个错误这种操作称为分解操作，只要对象是可迭代的多可以执行分解操作，这包括字符串，文件，迭代器和生成器。

a = [1,2,3,4]
b,c,d,e = a
b = 1, c = 2, d = 3, e = 4
b,c,e = a
ValueError:too many value to unpack

当作分解操作时没有时候会想丢弃一些特定的值，python并没有提供特殊的语法来实现这一点，但是可以用一个没有用的变量来保存要丢弃的值。
需要从某个可迭代对象中分解出N个元素，但是这个可迭代对象的长度超过N，这是可以使用*运算符，这个功能是在python3中支持的功能，python2中使用这个功能将报错
找到最大最小的n个元素
使用heapq这个模块可以实现，也可以将序列排序之后取前N个，或者后N个

import heapq
a = [1,2,3,4,5,6,7,8,9,10]
heapq.nlargest(3, a)
heapq.nsmallest(3, a)
[10,9,8]
[1,2,3]
a = (1,2,3,4,5,6,7,8,9,10)
heapq.nlargest(3, a)
heapq.nsmallest(3, a)
[10,9,8]
[1,2,3]

nlargest 和nsmallest返回的值始终都是一个列表,这两个函数可以应用于更加复杂的数据结构，例如字典

a = [{'name':'king', 'age':12}, {'name':'sky', 'age' : 33}, {'name':'array', 'age' : 44}]
heapq.nsmallest(2, a, key=lambda t:t['age'])
heapq.nlargest(2, a, key=lambda t:t['age'])
[{'age':12, 'name':'king'}, {'age':33, 'name':'sky'}]
[{'age':44, 'name':'array'}, {'age':33, 'name':'sky'}]

heapq还可以将队列重新以堆的顺序排列，堆最重要的特性是第一个元素总是最小的

a = [1,8,2,23,7,-4,18,23,42,37,2]
heapq.heapify(a)
a
[-4,2,1,23,7,2,18,42,37,8]
heapq.heappop(a)
-4
heapq.heappop(a)
1
heapq.heappop(a)
2
heapq.heappop(a)
2
heapq.heappop(a)
7
a
[8,23,18,23,42,37]

如果想找到最大最小的元素使用函数max()和min()即可
当任务有优先界别是，可以使用heapq来实现这样的优先级，每次取出优先级最高的元素处理。

字典是一个关联容器，每个键映射到一个单独的值上，如果让键映射多个值，可以将多个值保存到容器
上与键进行对应，这个容器可以是列表，也可以是集合。使用列表或是集合完全取决于应用的意图，
如果希望保存元素插入的顺序，那么使用列表，如果希望消除重复元素那就用集合
为了方便的创建字典可以使用defaultdict这个方法，

from collections import defaultdict
d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['a'].append(3)


d = defaultdict(set)
d['a'].add(1)
d['a'].add(1)
d['a'].add(3)

dict创建出来的字典是无序的，输出的顺序和插入顺序无关，如果希望输出顺序和插入顺序一直
那就需要使用有序字典，即collections模块中的OrderedDict类

from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
d
OrderedDict([('a', 1), ('b', 2), ('c',3), ('d', 4)])

OrderedDict内部维护了一个双向链表，他会根据元素加入的顺序来排列键的位置，第一个新加入的
元素被设置在链表的末尾，接下来对已经存在的键重新赋值，不会更改键的顺序。OrderedDict的大小是
普通字典大小的2倍多，这是由于他额外创建的链表所导致的。

zip可以将两个列表合并成一个列表，也可以将字典的键和值进行反转

a = [1,2,3,4]
b = [3,4,5,6]
zip(a,b)
[(1,3), (2,4),(3,5),(4,6)]
a = {'name':12, 'age':12}
zip(a.values(), a.keys())
[(12, 'name'), (12, 'age')]

zip会创建一个迭代器，他的内容只能被消费一次，这句话是什么意思呢？
书上说

prices = {'ACME' : 45.23, 'AAPL':612.78, 'IBM':205.55, 'HPQ':37.20, 'FB':10.75}
prices_and_names = zip(prices.values(), prices.keys())
print(min(prices_and_names)) //正常运行
print(max(prices_and_names)) //报错 max() arg is an empty sequence
但是实际运行结果，并没有错误，而且得到了正确的结果，测试环境python2.7

在字典上执行常见的数据操作会发现他们处理的是键，而不是值，如果只想得到最大键直接min() max() 字典即可，如果想获取嘴的值min（d.values()）
即可。如果想找到最大数据对应的键值，可以使用zip的功能将键和值反转之后，使用min和max，也可以适应min和max的第三个参数，指定比较的key
min(prices, key=lambda k:prices[k])
从序列中移除重复项目且保持元素间顺序不变，暂时没有什么好的方法，可以使用循环来实现，如果不需要保证元素顺序不变
移除重复元素，可以使用set来实现
a = [1,2,3,4,2,3,55]
set(a)