ShangYT的专栏

不积跬步,无以至千里

word2vec 词向量 分词效果对比

分词前后效果对比【不分词】 所有的商品名称本身作为term蔬菜 >>>>>>>> [马铃薯, 古柯叶, 芋头, 油茶籽, ...

2018-03-23 11:16:36

阅读数 590

评论数 0

dl4j LSTM分类

总结一下。参考http://blog.csdn.net/luoyexuge/article/details/73313586 这个博文很赞。1. 数据加载器还是要自己写的。你的数据格式,你的输入输出,需要动手实现一下,然后才能喂给网络2. 我处理的是中文,所以分词是个问题,报错好几次。终于不忍了,...

2018-03-22 14:31:56

阅读数 949

评论数 0

dl4j 报错 加载词向量

Unable to guess input file format. Please use corresponding loader directly【重点】保存模型,WordVectorSerializer.writeFullModel(vec, filePath+".vec&...

2018-03-22 10:46:31

阅读数 262

评论数 0

CSV文件 分类

org.deeplearning4j.examples.dataexamplesBasicCSVClassifier数据格式。一定要搞清楚数据格式,输入输出,才能构建网络。对应的是你手头有什么,想要做什么,预测什么?训练日志。这个例子只是举例,训练的效果不考虑。10:34:14,208 INFO ...

2018-03-20 10:55:53

阅读数 240

评论数 0

word2vec训练词向量

输入是分词之后的文本输出是词向量./word2vec -train tlbb.seg -output tlbb.seg.vec -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -threads 12 -binary 0

2018-03-20 10:02:10

阅读数 102

评论数 0

分词 天龙八部

自定义词典:段誉 段正明 段正淳 段延庆 皇妃 刀白凤 秦红棉 甘宝宝 阮星竹 王夫人 王语嫣 木婉清 钟灵 高升泰 巴天石 华赫艮 范晔 褚万里 古笃诚 傅思归 朱丹臣 南海鳄神 云中鹤 钟万仇 崔百泉 过彦之 枯荣大师 本因 本观 本相 本参 黄眉大师 破疑 破嗔 鸠摩智 萧峰 萧远山 阿朱 ...

2018-03-20 09:55:31

阅读数 273

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭