- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 《TensorFlow实战》学习1——softmax regression
作为书中第一个实战例子,“Tensorflow实现Softmax Regression识别手写数字”中使用的网络很简单,因为没有隐含层,都算不上神经网络。我也简单的记录一下这个实例中比较有价值的点吧。 一. 数据集本书中很多实例都是跑mnist数据集,此数据集很小只有55000张训练图片,10000张测试图片,5000张验证图片,图片的内容是0-9手写数字。图片是28*28的灰度图,空
2017-07-27 11:06:29 600
原创 gensim doc2vec + sklearn kmeans 做文本聚类
前一篇用doc2vec做文本相似度,模型可以找到输入句子最相似的句子,然而分析大量的语料时,不可能一句一句的输入,语料数据大致怎么分类也不能知晓。于是决定做文本聚类。选择kmeans作为聚类方法。前面doc2vec可以将每个段文本的向量计算出来,然后用kmeans就很好操作了。选择sklearn库中的KMeans类。程序如下:# coding:utf-8import sysi
2017-07-20 10:11:52 16986 7
原创 用gensim doc2vec计算文本相似度
最近开始接触gensim库,之前训练word2vec用Mikolov的c版本程序,看了很久才把程序看明白,在gensim库中,word2vec和doc2vec只需要几个接口就可以实现,实在是方便。python,我越来越爱你了。这个程序很简单,直接上程序了。# coding:utf-8import sysimport gensimimport sklearnimport numpy
2017-07-14 16:48:14 36615 20
原创 Word2vec+seq2seq实现对话系统
ChatScript做对话系统,做到一定程度后,便遇到了天花板,主要的瓶颈是中文wordnet比较难弄。下面先用word2vec+seq2seq尝试一下,基于机器学习的对话系统。如题,整个程序主要又两部分组成,word2vec将训练语料首先做词向量化,然后,用向量输入到seq2seq中训练。实际上tensorflow本身已经有一个完整的seq2seq模型,可以直接拿来训练,且tf自带的模型
2017-07-14 16:16:52 11096 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人