文本挖掘
lingerlanlan
我知道这些日子
你要承担多少哀伤
才可以面对破碎的梦想
展开
-
word2vec源码解析之word2phrase.c
最近研究了一下google的开源项目word2vector,http://code.google.com/p/word2vec/。其实这玩意算是神经网络在文本挖掘的一项成功应用。word2vec.c是核心代码,不过感觉先读word2phrase.c代码,再读前者比较好。一来word2phrase.c算法简单点,容易理解,二来word2phrase.c里面有些函数在word2vec.c会用到,读完word2phrase.c有助于读word2vec.c。原创 2014-07-22 21:08:36 · 9978 阅读 · 1 评论 -
word2vector学习笔记(一)
最近研究了一下google的开源项目word2vector,http://code.google.com/p/word2vec/。其实这玩意算是神经网络在文本挖掘的一项成功应用。本文是看了论文《Distributed Representations of Words and Phrases and their Compositionality》的学习笔记。原创 2014-07-22 20:06:45 · 35555 阅读 · 2 评论 -
word2vec源码解析之word2vec.c
//下面是我对word2vec.c的注释//详细算法可以参考论文,或者看这篇博客 http://www.cnblogs.com/downtjs/p/3784440.html// Copyright 2013 Google Inc. All Rights Reserved.//// Licensed under the Apache License, Version 2.0 (the原创 2014-07-28 19:00:41 · 24353 阅读 · 1 评论 -
bag-of-words model的java实现
bag-of-words model的java实现原创 2014-08-01 19:46:52 · 3733 阅读 · 0 评论 -
京东评论情感分类器(基于bag-of-words模型)
京东评论情感分类器(基于bag-of-words模型)原创 2014-08-08 19:13:19 · 6647 阅读 · 5 评论