NLP
Scofield_Phil
RxNLP.
展开
-
深度学习DeepLearning推荐论文清单 初学者入门推荐学习路线
深度学习DeepLearning papers初学者入门推荐学习论文清单(供下载)—————————————每一位DL初学者都想找到一条卓有成效的学习路线,我推荐的是沿着历史发展路线将前辈们的经典papers一一读一遍。所以有的兄弟已经做好了工作了:这里有位仁兄的(Deep Learning Papers Reading Roadmap就归纳了还比较齐全的paper清单。里面提供了下载器,但限于TGW的原创 2017-01-08 01:01:17 · 21149 阅读 · 1 评论 -
各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)
学习笔记:各大神经网络框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrentNN, recursiveNN)several basic neural networks[mlp, autoencoder, CNNs, recurrentNN, recursiveNN] impl原创 2018-01-19 16:09:43 · 8213 阅读 · 2 评论 -
TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注 源码
在TensorFlow (RNN)深度学习下 BiLSTM+CRF 跑 sequence labeling 双向LSTM+CRF跑序列标注问题去年底样子一直在做NLP相关task,是个关于序列标注问题。这 sequence labeling属于NLP的经典问题了,开始尝试用HMM,哦不,用CRF做baseline,by the way, 用的CRF++。关于CRF的理论就不再啰原创 2017-03-04 20:32:54 · 45201 阅读 · 5 评论 -
数据挖掘 NLP 之 文本挖掘 文本处理 通用流程
数据挖掘 NLP 之 文本挖掘 文本处理 通用流程 数据挖掘中的文本挖掘不论是对于企业应用,还是研究者工作,或者是参与数据竞赛项目,都是基础的工作。通过前面的一些实践工作,现总结出文本挖掘文本处理的通用流程。注意,这里的文本挖掘任务主要指的是如文本分类、文本聚类、信息抽取、情感分类等等的常规NLP问题。一、获取语料获取文本语料通原创 2017-06-07 22:18:52 · 15022 阅读 · 0 评论 -
NLP 主题抽取 Topic LDA代码实践 gensim包 代码
NLP 主题抽取Topic LDA代码实践 gensim包 代码 分享一个代码实践:用gensim包的LDA模型实践NLP的一个典型任务,主题抽取。 顺带提一点,对于NLP任务,最好的方式就是先在代码上跑通起来,然后再进行理论深究,最后自己实现DIY学习模型算法框架。 顺带再提一点,跑通NLP或者ML任务,推荐在Python下用原创 2017-06-07 22:49:13 · 10249 阅读 · 0 评论 -
NLP 工具包 大调查 自然语言处理工具包合集
NLP 工具包 大调查 自然语言处理工具包合集 可以想一想,如何你把NLP领域的所有的工具都能掌握的数如家珍,是不是很NB?必然的。 只用过这里面的一部分。。。 这份调查是基于使用语言差别来归纳的,别问我什么这么分类哈。。。一、多语言多环境编译1、THULA原创 2017-06-07 23:06:18 · 7218 阅读 · 0 评论 -
DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)
DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)词向量、word embedding、分布式表示、word2vec、glove 术语解释!自然语言处理表示学习词向量、word2vec无门槛理解! 其实顺便分享下,在我个人的方法论思维中,一个带有完整上下文以及结构构建良好的知识框架,在某种程度上,比一些细枝末节的详细知识点来的重要的多了!因为,一旦构建了一个完备的知识结构框架,那么剩下你要做的是将一些零零碎原创 2017-04-04 20:48:33 · 34693 阅读 · 32 评论 -
自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict
过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法。人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给人们的提升,然而最重要的一点却是机器学习算法的通用性。如果你想写一段程序来识别社交媒体平台上的侮辱性帖转载 2017-03-14 19:42:53 · 6524 阅读 · 0 评论 -
《数学之美》知识点详细总结
《数学之美》知识点详细总结From`RxNLP`Scofield未完待续 《数学之美》这本书在本科期间电子版上偶尔进行了翻阅,后来有时间了就完整的进行了阅读。出于老习惯,看完一本书后总会去总结书本的知识点层次框架,以更好地融入到原有的框架中。尤其是现入坑NLP,作为入门书,更应是好好吸收下。 评价:1、整本书的知识广度大于深度,原创 2017-04-05 17:15:32 · 6111 阅读 · 0 评论 -
Ubuntu安装tensorflow报错:tensorflow-xx.whl not a supported wheel on this platform
解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this platform.TensorFlow only be installed under a 64bit platform but not a 32bit machine!亲,TensorFlow是不支持32位机的~原创 2017-01-08 17:18:39 · 19120 阅读 · 6 评论 -
NLP 语料库 大全
此语料库清单包括了中文与英文,大家且看且珍惜……国内可用免费语料库(凡没有标注不可用的链接均可用)(一) 国家语委1.国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注转载 2017-03-04 16:46:42 · 12029 阅读 · 0 评论 -
概率图模型学习笔记:HMM、MEMM、CRF
概率图模型学习笔记:HMM、MEMM、CRF原创博客,转载请注明出处。From Scofield. RxNLP一、Preface二、Prerequisite 2.1 概率图 2.1.1 概览 2.1.2 有向图 vs. 无向图 2.1.3 马尔科夫假设&马尔科夫性 2.2 判别式模型 vs.原创 2018-01-29 15:00:57 · 7730 阅读 · 2 评论