- 博客(4)
- 资源 (5)
- 收藏
- 关注
转载 Word2Vec模型配置参数
用gensim函数库训练Word2Vec模型有很多配置参数。这里对gensim文档的Word2Vec函数的参数说明进行翻译,以便不时之需。class gensim.models.word2vec.Word2Vec(sentences=None,size=100,alpha=0.025,window=5, min_count=5, max_vocab_size=None, sample=0.001...
2019-07-23 16:21:52 1742
原创 节约读取pandas的内存资源
节约读取pandas的内存资源# reduce memorydef reduce_mem_usage(df, verbose=True): numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64'] start_mem = df.memory_usage().sum() / 1024**2 ...
2019-07-19 09:57:09 184
原创 用python调度hanlp
下载jpype1:https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype安装对应版本:pip install xxxxxx(对应文件)注意: pip install jpype1报错下载安装hanlp:官方文档:github:https://github.com/hankcs/HanLP下载地址:https://github.com/hankc...
2019-07-04 14:08:51 2126 1
原创 nltk扩展包下载慢解决办法
下载nltk非常简单:pip install nltk下载nltk扩展包:import nltknltk.download()之后会出现一个NLTK Downloader对话框然后点击下载,你会发现下载很慢,而且很容易出错.。解决办法:1.去github下载:https://github.com/nltk/nltk_data 里面的packages就是我们想要找到的nltk_d...
2019-07-04 13:19:45 9701 20
apache-hive-1.1.0-cdh5.7.1-bin.tar.gz
2018-05-22
Java核心必读书(包含面试题).rar
2018-05-10
hadoop-2.6.0-cdh5.7.1.tar.gz(编译版)
2018-05-10
spark-2.2.0-bin-2.6.0-cdh5.7.0.tg
2018-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人