__鸿-CSDN博客

原创 softmax的log似然代价函数（公式求导）

在人工神经网络（ANN）中，softmax通常被用作输出层的激活函数。这不仅是因为它的效果好，而且因为它使得ANN的输出值更易于理解。同时，它配合log似然代价函数，其训练效果也要比采用二次代价函数的方式好。

2016-04-02 21:59:01 70594 14

原创交叉熵代价函数（作用及公式推导）

交叉熵代价函数（Cross-entropy cost function）是用来衡量人工神经网络（ANN）的输出值与实际值的一种方式。与二次代价函数（Quadratic cost function）相比，它能更有效地配合反向传播算法，促进ANN的训练。

2016-04-02 18:22:52 128394 43

原创反向传播算法（过程及公式推导）

反向传播算法（Backpropagation）是目前用来训练人工神经网络（Artificial Neural Network，ANN）的最常用且最有效的算法。

2016-04-01 21:19:56 207485 62

原创模式识别与机器学习（二）：常用的概率分布（共轭分布等）

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记，正在研读中，欢迎交流讨论。

2016-03-10 21:07:37 24225 5

原创模式识别与机器学习（一）：概率论、决策论、信息论

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记，正在研读中，欢迎交流讨论。

2016-02-27 21:52:49 5282

原创红黑树的插入与删除

本文着重介绍了红黑树的插入和删除操作，由于网上很多介绍红黑树的博文只介绍操作过程，而不解释为什么进行该操作，或者仅仅用“符合红黑树的五个性质”一带而过，令人费解。因此，本文在介绍各种插入和删除操作的同时，会详细解释各个操作的作用。希望本文能够帮助你快速理解红黑树的插入和删除过程。

2015-08-10 22:50:59 2216 1

原创 LDA（Latent Dirichlet Allocation）简介

LDA（Latent Dirichlet Allocation）就是一种非常有效的无监督学习的主题生成模型。因为互联网中80%的信息都是以文本的形式存储，所以主题建模、文本分类等文本挖掘技术相当重要。

2014-10-06 20:18:07 4481

原创贝叶斯公式的共轭分布

共轭分布是一种极大简化贝叶斯分析的方法。其作用是有两个：1.简化贝叶斯公式中概率函数的计算；2.在贝叶斯公式包含多种概率分布的情况下，使这些分布的未知参数在试验前被赋予的物理意义，延续到试验后，便于分析。第二个作用尤为重要。

2014-10-06 08:13:18 5871

原创最大似然估计（Maximum likelihood estimation）

最大似然估计是一种非常有效的参数估计的数学方法，常用于在主题建模等领域。其思想是，对于已知的样本，假设它服从某种模型，估计模型中未知的参数，使该模型出现这些样本的概率最大。

2014-10-05 12:08:09 3741

原创贝叶斯球（Bayes ball）

贝叶斯球是贝叶斯网络中判断两个变量条件独立的方法。这个方法非常直观，在LDA（隐狄利克雷分布）主题建模中使用到。

2014-10-04 17:26:54 9601

原创经典的观点挖掘算法（文本挖掘系列）

最近阅读了美国伊利诺伊大学教授刘兵的一篇关于观点挖掘的KDD论文（Mining and Summarizing Customer Reviews），其观点挖掘算法非常经典，特此做记录，互相探讨。

2014-08-31 09:15:57 16864 1

原创 NDCG、AUC介绍

原创 EFM (Explicit Factor Models)显因子模型

一、概述 EFM ( Explicit Factor Models，显因子模型），是针对LFM (Latent Factor Models，隐因子模型) 的不足而设计的。LFM的特点如下： a. 通过分类抽象出隐因子空间。在分类过程中，我们不需要关心分类的角度，结果都是基于用户打分自动聚类的。分类的粒度通过设置LFM的最终分类数来控制。 b. 对

2014-08-08 15:46:10 6278

原创 Hadoop学习笔记（五）：MapReduce的类型与格式

在MapReduce中，map和reduce函数的输入和输出都是键值对（key/value）。1. MapReduce函数的常规格式MapReduce的函数一般遵循以下常规格式：map：（K1, V1）—> list（K2，V2）combine：（K2，list(V2)）—> list（K2，V2）partition：（K2，V2）—> integerreduce：

2014-07-25 23:55:37 2352

原创 Hadoop学习笔记（四）：Shuffle阶段

1. 定义 shuffle是指map任务输出到reduce任务输入的过程。2. 目的在Hadoop集群中，大部分map任务与reduce任务在不同的节点执行。因此，reduce任务在执行时需要跨节点去获取map的输出结果。如果集群上有很多作业，那么网络资源消耗会很严重，需要最大化减少不必要的资源。另外，如果map的输出和reduce的输入只是简单的磁盘

2014-07-23 23:19:12 3123 1

原创 Hadoop学习笔记（三）：作业调度器

早期的作业调度使用FIFO（First In First Out）调度算法，可以设置属性mapred.job.priority或者JobClient的setJobPriority( )方法来设定作业优先级，可配置的优先级有5个：VERY_HIGH, HIGH, NORMAL, LOW, VERY_LOW。除了FIFO调度器之外，还有两个多用户调度器，分别是Fair Schedul

2014-07-23 14:55:17 1089

原创 Hadoop学习笔记（二）：MapReduce的进度和状态

MapReduce的状态和进度

2014-07-22 17:01:05 8995

原创 Hadoop学习笔记（一）：MapReduce工作机制

MapReduce的运行过程如下图所示：

2014-07-21 17:54:28 1343

原创解决Hbase的几个常见bug

1. 在Eclipse中使用hbase和hadoop时遇到以下bug：

2014-07-12 20:01:06 2742

原创 Hadoop2.2.0 + HBase0.96 伪分布式安装

本文详细介绍Hadoop2.2.0和HBase0.96的伪分布式安装。在开始安装之前，先看Hadoop和HBase对应的版本支持，帮助入门的朋友少走弯路，避免版本不同导致安装失败的问题。

2014-06-07 13:30:48 1043

原创 NodeJS连接MySQL

以下内容讲述NodeJS连接MySQL的操作过程和常见错误。操作过程NodeJS连接数据库的操作很简单，只要在命令行下敲入命令：上述命令必须在node的安装目录下运行。如果想要在全局范围内安装，可以用 npm install -g mysql，mysql会被安装到C:\Users\user\AppData\Roaming\npm\node_modules目录下。No

2014-05-21 20:38:05 1157

原创 HashSet、LinkedHashSet、TreeSet的内部实现简介

在写这篇博客之前，本人已经介绍了HashMap、Linked

2014-04-26 22:14:06 2554

原创 TreeMap内部实现简介

1、概述TreeMap是Java内部实现比较复杂的集合类之一。与HashMap不一样，TreeMap的底层不是用哈希表实现的，而是用红黑树实现的。另外，HashMap存取元素的时间复杂度是O(1)的常量级，而TreeMap对元素的操作复杂度为O(log n)。虽然在操作性能方面，TreeMap不占优势，但是因为它使用红黑树（平衡二叉查找树）实现，所以它内部的元素都是排好序的。当需要查找的元

2014-04-26 17:06:57 2080

原创 LinkedHashMap内部实现

1、概述LinkedHashMap继承自HashMap，它能保证遍历元素时，输出的顺序和输入时的顺序相同。LinkedHashMap不仅实现HashMap的开散列哈希表（数组+链表），还维护着一个运行于所有键值对的双向链接列表。此列表定义了迭代的顺序，该迭代顺序包括插入顺序和访问顺序两种，默认是插入顺序；可以通过设置accessOrder为true，把迭代顺序设置为访问顺序。

2014-04-26 10:54:33 2127

原创 HashMap内部存储实现及HashTable比较

一、HashMap的内部存储实现HashMap底层实现的数据结构是哈希表。哈希表的实现一般有两种，第一种是数组（闭散列），第二种是数组+链表（开散列）。而HashMap采用的是“数组+链表”的实现，即数组存储链表的头结点。1、HashMap存储数据时进行put( key, value )的操作，源代码如下：[java] view plaincopy

2014-04-26 10:00:43 1541

原创 ajax跨域请求jsonp

1、用户访问其他域名服务器时，伪服务器把ajax加入到真实服务器返回的html页面（或js文件）；2、用户得到返回的请求后，ajax会自动执行：向伪服务器发送qq空间的请求，得到cookie，伪服务器把cookie中的qq号返回给ajax；3、ajax把qq号设置到该域名的cookie中。//nodejs伪服务器：（host文件：127.0.0.1 user.qz

2014-04-19 17:20:17 788

Arthur-Chen的专栏