Glove预训练词嵌入,主要包括如下四个文件:
1) glove.6B:Wikipedia 2014 + Gigaword 5 (6B tokens, 400K vocab, uncased, 50d, 100d, 200d, & 300d vectors, 822 MB download)
2) glove.42B.300d:Common Crawl (42B tokens, 1.9M vocab, uncased, 300d vectors, 1.75 GB download)
3)glove.840B.300d:Common Crawl (840B tokens, 2.2M vocab, cased, 300d vectors, 2.03 GB download)
4)glove.twitter.27B:Twitter (2B tweets, 27B tokens, 1.2M vocab, uncased, 25d, 50d, 100d, & 200d vectors, 1.42 GB download)
Python中init文件作用
1.init.py可以将所在文件夹变为一个python模块,python的每个模块对应的包中都有一个__init__.py文件的存在
2.通常__init__.py文件为空,但是我们还可以为它增加其他的功能,我们在**导入一个模块时候(也叫包),实际上导入的是这个模块的__init__.py文件。**我们可以在__init__.py导入我们需要的模块,不需要一个个导入
3.init.py 中还有一个重要的变量,叫做 all。我们有时会使出一招“全部导入”,也就是这样:from PackageName import *,这时 import 就会把注册在包 init.py 文件中 all 列表中的子模块和子包导入到当前作用域中来。比如:
#文件 init.py
all = [“Module1”, “Module2”, “subPackage1”, “subPackage2”]