Mr.Scofield

RxNLP.

DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)

DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation) 词向量、word embedding、分布式表示、word2vec、glove 术语解释! 自然语言处理表示学习 词向量、word2vec无门槛理解! ...

2017-04-04 20:48:33

阅读数 19820

评论数 21

来扯扯分布式数据库系统DDBS设计啊

我来扯扯分布式数据库系统DDBS的设计 注明:本文只是在完成一个高级数据库作业的文章,不能算是正儿八经登堂入室的paper,所以,不负责任哈,带坏小朋友不要找我哦 ^_~ 转载注明出处:Scofield's blog[  http://blog.csdn.net/scotfield_msn  ...

2017-03-04 21:01:41

阅读数 2300

评论数 0

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注 源码

在TensorFlow (RNN)深度学习下 BiLSTM+CRF 跑 sequence labeling  双向LSTM+CRF跑序列标注问题 去年底样子一直在做NLP相关task,是个关于序列标注问题。这 sequence labeling属于NLP的经典问题了,开始尝试用HMM,哦不,用...

2017-03-04 20:32:54

阅读数 39111

评论数 4

深度学习DeepLearning推荐论文清单 初学者入门推荐学习路线

深度学习DeepLearning papers初学者入门推荐学习论文清单(供下载)—————————————每一位DL初学者都想找到一条卓有成效的学习路线,我推荐的是沿着历史发展路线将前辈们的经典papers一一读一遍。所以有的兄弟已经做好了工作了:这里有位仁兄的(Deep Learning Pa...

2017-01-08 01:01:17

阅读数 15520

评论数 0

概率图模型学习笔记:HMM、MEMM、CRF

概率图模型学习笔记:HMM、MEMM、CRF 原创博客,转载请注明出处。 From Scofield. RxNLP 一、Preface 二、Prerequisite     2.1 概率图         2.1.1 概览         2.1.2 有向图 vs. ...

2018-01-29 15:00:57

阅读数 3678

评论数 2

各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)

学习笔记:各大神经网络框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrentNN, recursiveNN) several basic neural networks[mlp...

2018-01-19 16:09:43

阅读数 5338

评论数 2

scrapy爬取酒店评论数据

scrapy爬取酒店评论数据 代码 here:GitHub:scrapy_hotel_review 采用scrapy爬取酒店评论数据。 总共有28W条记录。 做某NLP任务,需要一些hotel reviews, 选择从www.booking.com搞一点数据来。 根据主页显示总共有2...

2018-01-19 15:35:08

阅读数 3394

评论数 1

NLP 工具包 大调查 自然语言处理工具包合集

NLP 工具包 大调查 自然语言处理工具包合集                 可以想一想,如何你把NLP领域的所有的工具都能掌握的数如家珍,是不是很NB?必然的。                 只用过这里面的一部分。。。                 这份调查是基于使用语言差别来归纳的...

2017-06-07 23:06:18

阅读数 5449

评论数 0

NLP 主题抽取 Topic LDA代码实践 gensim包 代码

NLP 主题抽取Topic LDA代码实践 gensim包 代码         分享一个代码实践:用gensim包的LDA模型实践NLP的一个典型任务,主题抽取。         顺带提一点,对于NLP任务,最好的方式就是先在代码上跑通起来,然后再进行理论深究,最后自己实现DIY学习模型...

2017-06-07 22:49:13

阅读数 6576

评论数 0

数据挖掘 NLP 之 文本挖掘 文本处理 通用流程

数据挖掘 NLP 之 文本挖掘 文本处理 通用流程   数据挖掘中的文本挖掘不论是对于企业应用,还是研究者工作,或者是参与数据竞赛项目,都是基础的工作。通过前面的一些实践工作,现总结出文本挖掘文本处理的通用流程。 注意,这里的文本挖掘任务主要指的是如文本分类、文本聚类、信息抽取、情感...

2017-06-07 22:18:52

阅读数 9752

评论数 0

从不同角度看机器学习的几种学习方式

从不同角度看机器学习的几种学习方式: 1、在线学习与离线学习 offline learning and online learning.  In offline learning, the whole training data must be available at ...

2017-04-27 20:11:22

阅读数 4712

评论数 0

机器学习 数据挖掘 数据集划分 训练集 验证集 测试集

机器学习之数据集划分: 训练集 验证集 测试集 Q:将数据集划分为测试数据集和训练数据集的常用套路是什么呢? A:three ways shown as follow: 1.像sklearn一样,提供一个将数据集切分成训练集和测试集的函数: 默认是把数据集的75%作为训练集,把数据集...

2017-04-10 12:40:59

阅读数 8594

评论数 0

《数学之美》知识点详细总结

《数学之美》知识点详细总结 From`RxNLP`Scofield 未完待续           《数学之美》这本书在本科期间电子版上偶尔进行了翻阅,后来有时间了就完整的进行了阅读。出于老习惯,看完一本书后总会去总结书本的知识点层次框架,以更好地融入到原有的框架中。尤其是现入坑NLP,作...

2017-04-05 17:15:32

阅读数 4533

评论数 0

[转发]机器学习资源大全

机器学习资源大全 本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。 C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLA...

2017-04-03 11:05:28

阅读数 3284

评论数 0

pycharm 2017激活码 有效

pycharm 2017激活码 有效 大家都知道,2016版的pycharm激活码都已经失效了, 现在贴出2017版的激活码,亲测有效! 43B4A73YYJ-eyJsaWNlbnNlSWQiOiI0M0I0QTczWVlKIiwibGljZW5zZWVOYW1lIjoibGFuIHl1I...

2017-03-18 21:43:49

阅读数 15493

评论数 1

python机器学习包 Windows下 pip安装 scikit-learn numpy scipy

python机器学习包 Windows10下 pip安装 scikit-learn numpy scipy requirements: ` windows10 ` python2.7 ` pip9.0.1 ` numpy ` scipy ` sklearn 1  pip的安装 1.1  ...

2017-03-18 21:21:33

阅读数 6683

评论数 0

自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict

过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法。 人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给...

2017-03-14 19:42:53

阅读数 4861

评论数 0

python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数

python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数 在 Python 中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数 5种参数形式。 这 5 种参数都可以组合起来使用,但是注意,参数定义的顺序必须是:必选参数、默认参数、可变参数/...

2017-03-04 23:38:02

阅读数 7081

评论数 0

python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'

python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines' 在用pandas读取csv数据进行处理时,报了个错: pd.read_csv(train_pat...

2017-03-04 19:24:16

阅读数 5807

评论数 0

ubuntu下 tensorflow 升级到 新版本 0.11.0版本

ubuntu 升级 tensorflow 到 0.11.0版本 之前在ubuntu上安装的比较早的0.8版本的TensorFlow,现在遇到一些库的不兼容问题,所以得升级下tf包。 1:确认最可升级的最高版本【https://www.tensorflow.org/versions/】, 注...

2017-03-04 17:19:58

阅读数 6066

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭