- 博客(8)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 TensorFlow 模型保存和恢复示例
前言在之前一篇文章里:使用CNN+ Auto-Encoder 实现无监督Sentence Embedding (代码基于Tensorflow),训练完成后,encode的参数也就被训练好了,这个时候我们利用这些参数对数据进行编码处理,从而得到一个向量。保存模型如果回忆下,上次的模型基本是这样的:Input(段落) -> encoder -&g...
2017-05-31 17:14:00 161 1
原创 我是不是应该转行机器学习?
开始先说结论: 要不要转行,不妨先业余时间玩一把,看这个是不是真的适合自己,然后再去做决定。这篇文章谈及了我对机器学习的一些看法,希望能有所帮助。说个笑话上次在微博上看,说是马云说数据是...
2017-05-30 20:59:45 193
原创 使用CNN+ Auto-Encoder 实现无监督Sentence Embedding (代码基于Tensorflow)
前言这篇文章会利用到上一篇: 基于Spark /Tensorflow使用CNN处理NLP的尝试的数据预处理部分,也就是如何将任意一段长度的话表征为一个2维数组。本文完整的代码在这: autoencoder-sentence-similarity.py基本思路是,通过编码解码网络(有点类似微软之前提出的对偶学习),先对句子进行编码,然后进行解码,解码...
2017-05-27 22:55:00 2562 2
原创 基于Spark /Tensorflow使用CNN处理NLP的尝试
前言关于CNN如何和NLP结合,其实是被这篇文章指导入门的 。 我觉得使用CNN去处理一些NLP的分类问题,是非常不错的。主要好处有:CNN能自动抽取出一些高级特征,减少了特征工程的时间使用WordEmbedding技术将词汇表达为向量后,可以很方便的将文本表示为类似图片的2D向量神经网络表达能力强缺点的话,就是目前我还没想到如何把一些非文...
2017-05-25 19:04:00 727 10
原创 微信为啥推出实验室功能
之前写过一篇文章,【物尽其用-让推荐系统成为你学习的助手】,还原了推荐的本质:你只要调教下推荐系统,然后你就获得了一个信息助理,源源不断把你需要或者感兴趣的内容投送给你。搜索的问题局限在于关键字,关键字带来的问题是信息太窄,如果你需要的是关键字泛化后的内容,那么搜索就无能为力了。譬如我们对一个领域不太熟悉,想找一些自己也不知道的内容,对于搜索而言,难度...
2017-05-22 09:43:00 215 1
原创 微信为啥推出实验室功能
之前写过一篇文章,【物尽其用-让推荐系统成为你学习的助手】,还原了推荐的本质:你只要调教下推荐系统,然后你就获得了一个信息助理,源源不断把你需要或者感兴趣的内容投送给你。搜索的问题局限...
2017-05-21 19:30:09 132
原创 数据团队规划布局感悟(三)
前言自己也没想到马上会有第三篇了。前面两篇的地址如下:数据团队规划布局感悟(一)数据团队规划布局感悟(二)今天重点讲讲我对感悟(一)中提及的“解决方案设计团队”的看法。其实这个名字是我瞎起的,对应的是大家熟知的“算法团队”或者“机器学习团队”。关于几个名词的认识机器学习团队做的事情,我觉得有个简单的规则来判定:普通研发团队觉得实现不了...
2017-05-16 21:31:00 904 1
原创 数据团队规划布局感悟(二)
前言这篇内容承接了第一篇文章 数据团队规划布局感悟(一)。在前公司的时候,因为同事经验都很丰富,大体都5年+,十年的也不乏其人,所以基本没有所谓管理,而在那个阶段,我更关注的也是技术,对管理本身并没有太大兴趣。来了现在的公司之后,团队的新人比较多,刚工作没多久的同事占的比重也较高,这个时候如果还想要产出,大体就需要一个有效的管理组织方式了,“好整以暇...
2017-05-02 22:52:00 340 2
hibernate 关联保存 的困惑
2009-10-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人