machine learning
Eadon999
机器学习、推荐算法
展开
-
sklearn 生成中文词向量与tfidf
一、英文的词向量生成想必大家都已经能从官网学到,利用sklean的CoutVectorizer模块即可简单生成,借用官网例子:from sklearn.feature_extraction.text import CountVectorizer,TfidfTransformervecizer = CountVectorizer()corpus = [ 'This is the first d...原创 2018-06-12 21:24:54 · 7601 阅读 · 1 评论 -
输出tf.SparseTensorValue值-----使用稀疏的离散特征提高内存利用率
在做推荐算法,采用FM模型时采用tf.sparse_placeholder函数,会比较省内存一、tf.sparse_placeholder与tf.SparseTensorValue1.tf.sparse_placeholder支持mutil one2.tf.tf.SparseTensorValue函数三个需要设置的参数:1)indices:指定哪些位置上有值,其他位置为默认值(...原创 2019-03-06 23:06:01 · 5430 阅读 · 2 评论 -
facebook更新FastText工程--新增模型压缩论文的实现模型大小缩减80%--文本分类词向量fasttext
Facebook 于北京时间2019年6月25日更新FastText代码,增加了FastText.ZIP:Compressing Text Classification Models论文的模型压缩实现,论文地址https://arxiv.org/abs/1612.03651压缩后的模型能减小到10M以内一、新版函数的变化1.classification text的supervisor(...原创 2019-06-26 15:47:03 · 1467 阅读 · 0 评论