在学习用tensorflow打造唐诗生成网络时看到如下函数:
words,_=zip(*count_paris)
words = words[: len(words)]
word_int_map = dict(zip(words,range(len(words))))
代码中的count_paris为类似[你:2, 我:3 , 他:5,好:4,……]的list,里面包含词及其对应的个数;
第一句代码含义表示提取words=[你,我,他]
第二句代码含义表示取前len(words)个词构成的words,这里的长度可依据实际情况更改,思路是保留高频词汇;例如len取了3,最后words=(你,我,他)
第三句代码就是将中文词汇和对应计算机能识别的数字做映射,这里举的例子很简单,和range(保留词个数)的数字多对应;例如range(3),则表示数字范围为0,1,2;则zip((你,我,他),(0,1,2))后变为[(你,0),(我,1),(他,2)]
zip()函数
描述
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。
语法
zip 语法:
zip([iterable, ...])
参数说明:
- iterabl -- 一个或多个迭代器;
返回值
返回元组列表。
实例
以下实例展示了 zip 的使用方法:
>>>
a
=
[
1
,
2
,
3
]
>>> b = [ 4 , 5 , 6 ]
>>> c = [ 4 , 5 , 6 , 7 , 8 ]
>>> zipped = zip ( a , b ) # 打包为元组的列表
[ ( 1 , 4 ) , ( 2 , 5 ) , ( 3 , 6 ) ]
>>> zip ( a , c ) # 元素个数与最短的列表一致
[ ( 1 , 4 ) , ( 2 , 5 ) , ( 3 , 6 ) ]
>>> zip ( * zipped ) # 与 zip 相反,可理解为解压,返回二维矩阵式
[ ( 1 , 2 , 3 ) , ( 4 , 5 , 6 ) ]
>>> b = [ 4 , 5 , 6 ]
>>> c = [ 4 , 5 , 6 , 7 , 8 ]
>>> zipped = zip ( a , b ) # 打包为元组的列表
[ ( 1 , 4 ) , ( 2 , 5 ) , ( 3 , 6 ) ]
>>> zip ( a , c ) # 元素个数与最短的列表一致
[ ( 1 , 4 ) , ( 2 , 5 ) , ( 3 , 6 ) ]
>>> zip ( * zipped ) # 与 zip 相反,可理解为解压,返回二维矩阵式
[ ( 1 , 2 , 3 ) , ( 4 , 5 , 6 ) ]