自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (1)
  • 收藏
  • 关注

原创 softmax的log似然代价函数(公式求导)

在人工神经网络(ANN)中,softmax通常被用作输出层的激活函数。这不仅是因为它的效果好,而且因为它使得ANN的输出值更易于理解。同时,它配合log似然代价函数,其训练效果也要比采用二次代价函数的方式好。

2016-04-02 21:59:01 69567 13

原创 交叉熵代价函数(作用及公式推导)

交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的输出值与实际值的一种方式。与二次代价函数(Quadratic cost function)相比,它能更有效地配合反向传播算法,促进ANN的训练。

2016-04-02 18:22:52 127102 43

原创 反向传播算法(过程及公式推导)

反向传播算法(Backpropagation)是目前用来训练人工神经网络(Artificial Neural Network,ANN)的最常用且最有效的算法。

2016-04-01 21:19:56 204638 62

原创 模式识别与机器学习(二):常用的概率分布(共轭分布等)

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记,正在研读中,欢迎交流讨论。

2016-03-10 21:07:37 23786 7

原创 模式识别与机器学习(一):概率论、决策论、信息论

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记,正在研读中,欢迎交流讨论。

2016-02-27 21:52:49 5131

原创 红黑树的插入与删除

本文着重介绍了红黑树的插入和删除操作,由于网上很多介绍红黑树的博文只介绍操作过程,而不解释为什么进行该操作,或者仅仅用“符合红黑树的五个性质”一带而过,令人费解。因此,本文在介绍各种插入和删除操作的同时,会详细解释各个操作的作用。希望本文能够帮助你快速理解红黑树的插入和删除过程。

2015-08-10 22:50:59 2111 1

原创 LDA(Latent Dirichlet Allocation)简介

LDA(Latent Dirichlet Allocation)就是一种非常有效的无监督学习的主题生成模型。因为互联网中80%的信息都是以文本的形式存储,所以主题建模、文本分类等文本挖掘技术相当重要。

2014-10-06 20:18:07 4273

原创 贝叶斯公式的共轭分布

共轭分布是一种极大简化贝叶斯分析的方法。其作用是有两个:1.简化贝叶斯公式中概率函数的计算;2.在贝叶斯公式包含多种概率分布的情况下,使这些分布的未知参数在试验前被赋予的物理意义,延续到试验后,便于分析。第二个作用尤为重要。

2014-10-06 08:13:18 5745

原创 最大似然估计(Maximum likelihood estimation)

最大似然估计是一种非常有效的参数估计的数学方法,常用于在主题建模等领域。其思想是,对于已知的样本,假设它服从某种模型,估计模型中未知的参数,使该模型出现这些样本的概率最大。

2014-10-05 12:08:09 3596

原创 贝叶斯球(Bayes ball)

贝叶斯球是贝叶斯网络中判断两个变量条件独立的方法。这个方法非常直观,在LDA(隐狄利克雷分布)主题建模中使用到。

2014-10-04 17:26:54 8859

原创 经典的观点挖掘算法(文本挖掘系列)

最近阅读了美国伊利诺伊大学教授刘兵的一篇关于观点挖掘的KDD论文(Mining and Summarizing Customer Reviews),其观点挖掘算法非常经典,特此做记录,互相探讨。

2014-08-31 09:15:57 16672 4

原创 NDCG、AUC介绍

最近在

2014-08-30 15:41:15 20167 3

原创 EFM (Explicit Factor Models)显因子模型

一、概述       EFM ( Explicit Factor Models,显因子模型),是针对LFM (Latent Factor Models,隐因子模型) 的不足而设计的。LFM的特点如下:       a. 通过分类抽象出隐因子空间。在分类过程中,我们不需要关心分类的角度,结果都是基于用户打分自动聚类的。分类的粒度通过设置LFM的最终分类数来控制。       b. 对

2014-08-08 15:46:10 5886

原创 Hadoop学习笔记(五):MapReduce的类型与格式

在MapReduce中,map和reduce函数的输入和输出都是键值对(key/value)。1. MapReduce函数的常规格式MapReduce的函数一般遵循以下常规格式:map:(K1, V1)—> list(K2,V2)combine:(K2,list(V2))—> list(K2,V2)partition:(K2,V2)—> integerreduce:

2014-07-25 23:55:37 2188

原创 Hadoop学习笔记(四):Shuffle阶段

1. 定义       shuffle是指map任务输出到reduce任务输入的过程。2. 目的       在Hadoop集群中,大部分map任务与reduce任务在不同的节点执行。因此,reduce任务在执行时需要跨节点去获取map的输出结果。如果集群上有很多作业,那么网络资源消耗会很严重,需要最大化减少不必要的资源。另外,如果map的输出和reduce的输入只是简单的磁盘

2014-07-23 23:19:12 2963 1

原创 Hadoop学习笔记(三):作业调度器

早期的作业调度使用FIFO(First In First Out)调度算法,可以设置属性mapred.job.priority或者JobClient的setJobPriority( )方法来设定作业优先级,可配置的优先级有5个:VERY_HIGH, HIGH, NORMAL, LOW, VERY_LOW。       除了FIFO调度器之外,还有两个多用户调度器,分别是Fair Schedul

2014-07-23 14:55:17 1018

原创 Hadoop学习笔记(二):MapReduce的进度和状态

MapReduce的状态和进度

2014-07-22 17:01:05 8760

原创 Hadoop学习笔记(一):MapReduce工作机制

MapReduce的运行过程如下图所示:

2014-07-21 17:54:28 1266

原创 解决Hbase的几个常见bug

1. 在Eclipse中使用hbase和hadoop时遇到以下bug:

2014-07-12 20:01:06 2659

原创 Hadoop2.2.0 + HBase0.96 伪分布式安装

本文详细介绍Hadoop2.2.0和HBase0.96的伪分布式安装。在开始安装之前,先看Hadoop和HBase对应的版本支持,帮助入门的朋友少走弯路,避免版本不同导致安装失败的问题。

2014-06-07 13:30:48 985

原创 NodeJS连接MySQL

以下内容讲述NodeJS连接MySQL的操作过程和常见错误。操作过程NodeJS连接数据库的操作很简单,只要在命令行下敲入命令:上述命令必须在node的安装目录下运行。如果想要在全局范围内安装,可以用 npm install -g mysql,mysql会被安装到C:\Users\user\AppData\Roaming\npm\node_modules目录下。No

2014-05-21 20:38:05 1023

原创 HashSet、LinkedHashSet、TreeSet的内部实现简介

在写这篇博客之前,本人已经介绍了HashMap、Linked

2014-04-26 22:14:06 2459

原创 TreeMap内部实现简介

1、概述TreeMap是Java内部实现比较复杂的集合类之一。与HashMap不一样,TreeMap的底层不是用哈希表实现的,而是用红黑树实现的。另外,HashMap存取元素的时间复杂度是O(1)的常量级,而TreeMap对元素的操作复杂度为O(log n)。虽然在操作性能方面,TreeMap不占优势,但是因为它使用红黑树(平衡二叉查找树)实现,所以它内部的元素都是排好序的。当需要查找的元

2014-04-26 17:06:57 1997

原创 LinkedHashMap内部实现

1、概述LinkedHashMap继承自HashMap,它能保证遍历元素时,输出的顺序和输入时的顺序相同。LinkedHashMap不仅实现HashMap的开散列哈希表(数组+链表),还维护着一个运行于所有键值对的双向链接列表。此列表定义了迭代的顺序,该迭代顺序包括插入顺序和访问顺序两种,默认是插入顺序;可以通过设置accessOrder为true,把迭代顺序设置为访问顺序。

2014-04-26 10:54:33 2043

原创 HashMap内部存储实现及HashTable比较

一、HashMap的内部存储实现HashMap底层实现的数据结构是哈希表。哈希表的实现一般有两种,第一种是数组(闭散列),第二种是数组+链表(开散列)。而HashMap采用的是“数组+链表”的实现,即数组存储链表的头结点。1、HashMap存储数据时进行put( key, value )的操作,源代码如下:[java] view plaincopy

2014-04-26 10:00:43 1473

原创 ajax跨域请求jsonp

1、用户访问其他域名服务器时,伪服务器把ajax加入到真实服务器返回的html页面(或js文件);2、用户得到返回的请求后,ajax会自动执行:向伪服务器发送qq空间的请求,得到cookie,伪服务器把cookie中的qq号返回给ajax;3、ajax把qq号设置到该域名的cookie中。//nodejs伪服务器:(host文件:127.0.0.1  user.qz

2014-04-19 17:20:17 748

winutils.exe:解决hadoop在windows运行出现的bug

如果出现如下bug:“Could not locate executable null\bin\winutils.exe in the Hadoop binaries”,则下载该文件,放入hadoop的bin文件夹下,并设置环境变量HADOOP_HOME:F:\hadoop2.2.0即可。

2014-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除