TonLP的博客

意见挖掘,个人学习记录

中心极限定理的一个例子:大小医院的新生儿

一个问题在复习概率论与数理统计的时候,发现一个有趣的例子: 两家医院,大医院每天新生儿45个,小医院新生儿15个,问一年内哪家医院男新生儿比例超过60%的天数多的可能性大?乍眼一看,直觉告诉我新生儿的自然男女比例应该固定在50%左右的某个值,两家医院的男女概率应该都是这个值,所以两家医院的可能性...

2017-03-20 11:48:18

阅读数 1274

评论数 0

RBM(Restricted Bolzmann Machines)原理

玻尔兹曼机是一种随机网络,它基于能量模型进行建模。能量模型我们一般认为物体的能量越高越不稳定,能量越低越趋于稳定。比如说,斜坡上的一个箱子,它位于越高的位置,则拥有更高的重力势能。能量模型把箱子停在哪个位置定义为一种状态,每个状态对应着一个能量。这个能量由能量函数来定义,箱子位于某个位置(某个位置...

2017-01-04 21:29:43

阅读数 1791

评论数 0

循环神经网络(一般RNN)推导

本文章的例子来自于WILDMLvanillaRNN是相比于LSTMs和GRUs简单的循环神经网络,可以说是最简单的RNN。RNN结构RNN的一个特点是所有的隐层共享参数(U,V,W)(U, V, W),整个网络只用这一套参数。RNN前向传导st=tanh(Uxt+Wst−1)s_t=tanh(Ux...

2016-12-26 13:42:51

阅读数 12189

评论数 6

卷积神经网络反向传播推导

以TensorFlow的卷积神经网络为例卷积-池-卷积-池-全连接-softmax 前向传导C1层:卷积神经网络的输入是28×28的矩阵AA,经过F1F_1个5×5的卷积核K1i(i=1,2,...,F1)K_i^1(i=1,2,...,F_1)的卷积生成F1F_1个24×24大小的featur...

2016-12-22 21:46:52

阅读数 3004

评论数 0

TensorFlow的卷积神经网络例子解析

TensorFlow教程地址:https://www.tensorflow.org/tutorials/mnist/pros/ 讲的是经典的机器学习问题MNIST。 使用卷积神经网络进行训练。载入MNIST数据MNIST数据可以从这里下载from tensorflow.examples.tut...

2016-12-22 15:19:41

阅读数 6679

评论数 4

分别使用sk-learn和mllib进行文本情感分类

总体思路 文本预处理 提取特征 特征选择 选择分类算法 训练和评估

2016-12-14 09:51:23

阅读数 1639

评论数 1

神经网络推导

首先介绍一个学习DL4NLP的一个网站WildML,英文的,有空我也整理一下中文版。这篇讲的是神经网络的基础,没有RNN、CNN等结构。废话少说,直接上要推导的一个简单的神经网络结构图。例子:三层神经网络这个神经网络包含一个输入层、一个隐含层和一个输出层。 注意输出的神经元有两个(多个),这个经...

2016-12-06 21:10:52

阅读数 337

评论数 0

SublimeREPL配置Python运行命令,更换Python路径

SublimeREPL介绍SublimeREPL是编辑器Sublime Text上的一个支持各种语言解释器的插件,可以方便我们在编辑器上编写完代码进行调试。安装方法强烈推荐使用Package Control进行插件安装。安装步骤: 1. cmd+shift+p调出快捷命令窗口,输入install...

2016-11-23 16:38:42

阅读数 19986

评论数 2

通过word embedding和关联规则改进Aspect提取效果

思路来源于论文《Improving Opinion Aspect Extraction Using Semantic Similarity and Aspect Association》(Liu, Zhang et al.,2016)

2016-11-08 17:05:21

阅读数 1204

评论数 1

LTM(Lifelong Topic Modeling)介绍

LTM(Lifelong Topic Modeling)介绍论文题目是《Topic Modeling using Topics from Many Domains, Lifelong Learning and Big Data》(Chen and Liu, 2014) 摘要:Topic mod...

2016-11-05 20:15:11

阅读数 546

评论数 0

LML(Lifelong Machine Learning)介绍

LML(Lifelong Machine Learning)介绍最近做评论分析碰到一些瓶颈,阅读了众多论文,还是觉得刘兵老师靠谱,实用派的翘楚。于是了解了他近年来发的论文,发现了一个很新颖的词”lifelong”,而且还在KDD 2016做tutorial,题为《Lifelong Machine ...

2016-11-04 23:15:20

阅读数 1245

评论数 0

Redis安装和远程访问

Redis安装和远程访问安装下载地址: redis下载地址下面是官方的编译安装方法:$ wget http://download.redis.io/releases/redis-3.2.5.tar.gz $ tar xzf redis-3.2.5.tar.gz $ cd redis-3.2.5 ...

2016-11-03 10:58:58

阅读数 474

评论数 0

使用JSONRPC 2.0规范解决多语言RPC交互的方案

使用JSONRPC 2.0规范解决多语言RPC交互的方案动机最近做的一个项目比较大,分了许多模块,但是由于不同的开源技术使用的语言不同,不同模块使用的语言可能不同,但基本上是使用Java和Python实现的。当各模块需要进行交互的时候,问题就出现了,模块不能像Jar包或者Python模块那样引入,...

2016-11-01 10:45:48

阅读数 1283

评论数 0

一个监控iPhone7p港行预约货存的脚本

一个监控iPhone7p港行预约货存的脚本github地址:Apple_Monitor主要技术 Python urllib2、json库 Server酱的微信提醒功能 流程 使用chrome浏览器的开发者工具监控iphone预约页面的http包 从中找到包含iphone型号和HK专卖店的信息的ht...

2016-11-01 10:43:36

阅读数 682

评论数 0

刘兵《Entity and aspect extraction for opinion mining 》翻译笔记

刘兵《Entity and aspect extraction for opinion mining 》翻译笔记 转载请声明出处。 这是一本书的一个章节(49页),书名叫《Data mining and knowledge discovery for big data》2014年Springe...

2016-11-01 10:41:29

阅读数 2470

评论数 1

python NLP工具 polyglot在centos 6 上安装

python NLP工具 polyglot在centos 6 上安装最近要做多语言的文本处理,就去调研一下有什么好用的现成工具,最后发现了polyglot。 这工具虽说支持多语言,但是用过发现比不是很好用,可能做多难做精。还是写一下怎么安装吧。初入坑先说说最初遇到的坑:polyglot官网上的i...

2016-11-01 10:39:14

阅读数 1010

评论数 1

使用Flask快速搭建前端

使用Flask快速搭建前端Flask介绍Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2。 Flask也被成为『微框架』。因为它使用简单的核心,用 extension 增加其他功能。Flask没有默认使...

2016-11-01 10:33:38

阅读数 2727

评论数 0

在我的Macbook Pro上安装能使用GPU加速的Theano

在我的Macbook Pro上安装能使用GPU加速的Theano目的最近深度学习的应用非常火爆,有意向要在NLP上应用深度学习的我要对各种开源的深度学习库进行探索,目前比较流行的Python语言的深度学习库有Theano、Google开源的Tensorflow、keras等。由于我日常使用的机器都...

2016-11-01 10:29:43

阅读数 7129

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭