- 博客(26)
- 资源 (1)
- 收藏
- 关注
原创 softmax的log似然代价函数(公式求导)
在人工神经网络(ANN)中,softmax通常被用作输出层的激活函数。这不仅是因为它的效果好,而且因为它使得ANN的输出值更易于理解。同时,它配合log似然代价函数,其训练效果也要比采用二次代价函数的方式好。
2016-04-02 21:59:01 69567 13
原创 交叉熵代价函数(作用及公式推导)
交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的输出值与实际值的一种方式。与二次代价函数(Quadratic cost function)相比,它能更有效地配合反向传播算法,促进ANN的训练。
2016-04-02 18:22:52 127102 43
原创 反向传播算法(过程及公式推导)
反向传播算法(Backpropagation)是目前用来训练人工神经网络(Artificial Neural Network,ANN)的最常用且最有效的算法。
2016-04-01 21:19:56 204638 62
原创 模式识别与机器学习(二):常用的概率分布(共轭分布等)
本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记,正在研读中,欢迎交流讨论。
2016-03-10 21:07:37 23786 7
原创 模式识别与机器学习(一):概率论、决策论、信息论
本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记,正在研读中,欢迎交流讨论。
2016-02-27 21:52:49 5131
原创 红黑树的插入与删除
本文着重介绍了红黑树的插入和删除操作,由于网上很多介绍红黑树的博文只介绍操作过程,而不解释为什么进行该操作,或者仅仅用“符合红黑树的五个性质”一带而过,令人费解。因此,本文在介绍各种插入和删除操作的同时,会详细解释各个操作的作用。希望本文能够帮助你快速理解红黑树的插入和删除过程。
2015-08-10 22:50:59 2111 1
原创 LDA(Latent Dirichlet Allocation)简介
LDA(Latent Dirichlet Allocation)就是一种非常有效的无监督学习的主题生成模型。因为互联网中80%的信息都是以文本的形式存储,所以主题建模、文本分类等文本挖掘技术相当重要。
2014-10-06 20:18:07 4273
原创 贝叶斯公式的共轭分布
共轭分布是一种极大简化贝叶斯分析的方法。其作用是有两个:1.简化贝叶斯公式中概率函数的计算;2.在贝叶斯公式包含多种概率分布的情况下,使这些分布的未知参数在试验前被赋予的物理意义,延续到试验后,便于分析。第二个作用尤为重要。
2014-10-06 08:13:18 5745
原创 最大似然估计(Maximum likelihood estimation)
最大似然估计是一种非常有效的参数估计的数学方法,常用于在主题建模等领域。其思想是,对于已知的样本,假设它服从某种模型,估计模型中未知的参数,使该模型出现这些样本的概率最大。
2014-10-05 12:08:09 3596
原创 贝叶斯球(Bayes ball)
贝叶斯球是贝叶斯网络中判断两个变量条件独立的方法。这个方法非常直观,在LDA(隐狄利克雷分布)主题建模中使用到。
2014-10-04 17:26:54 8859
原创 经典的观点挖掘算法(文本挖掘系列)
最近阅读了美国伊利诺伊大学教授刘兵的一篇关于观点挖掘的KDD论文(Mining and Summarizing Customer Reviews),其观点挖掘算法非常经典,特此做记录,互相探讨。
2014-08-31 09:15:57 16672 4
原创 EFM (Explicit Factor Models)显因子模型
一、概述 EFM ( Explicit Factor Models,显因子模型),是针对LFM (Latent Factor Models,隐因子模型) 的不足而设计的。LFM的特点如下: a. 通过分类抽象出隐因子空间。在分类过程中,我们不需要关心分类的角度,结果都是基于用户打分自动聚类的。分类的粒度通过设置LFM的最终分类数来控制。 b. 对
2014-08-08 15:46:10 5886
原创 Hadoop学习笔记(五):MapReduce的类型与格式
在MapReduce中,map和reduce函数的输入和输出都是键值对(key/value)。1. MapReduce函数的常规格式MapReduce的函数一般遵循以下常规格式:map:(K1, V1)—> list(K2,V2)combine:(K2,list(V2))—> list(K2,V2)partition:(K2,V2)—> integerreduce:
2014-07-25 23:55:37 2188
原创 Hadoop学习笔记(四):Shuffle阶段
1. 定义 shuffle是指map任务输出到reduce任务输入的过程。2. 目的 在Hadoop集群中,大部分map任务与reduce任务在不同的节点执行。因此,reduce任务在执行时需要跨节点去获取map的输出结果。如果集群上有很多作业,那么网络资源消耗会很严重,需要最大化减少不必要的资源。另外,如果map的输出和reduce的输入只是简单的磁盘
2014-07-23 23:19:12 2963 1
原创 Hadoop学习笔记(三):作业调度器
早期的作业调度使用FIFO(First In First Out)调度算法,可以设置属性mapred.job.priority或者JobClient的setJobPriority( )方法来设定作业优先级,可配置的优先级有5个:VERY_HIGH, HIGH, NORMAL, LOW, VERY_LOW。 除了FIFO调度器之外,还有两个多用户调度器,分别是Fair Schedul
2014-07-23 14:55:17 1018
原创 Hadoop2.2.0 + HBase0.96 伪分布式安装
本文详细介绍Hadoop2.2.0和HBase0.96的伪分布式安装。在开始安装之前,先看Hadoop和HBase对应的版本支持,帮助入门的朋友少走弯路,避免版本不同导致安装失败的问题。
2014-06-07 13:30:48 985
原创 NodeJS连接MySQL
以下内容讲述NodeJS连接MySQL的操作过程和常见错误。操作过程NodeJS连接数据库的操作很简单,只要在命令行下敲入命令:上述命令必须在node的安装目录下运行。如果想要在全局范围内安装,可以用 npm install -g mysql,mysql会被安装到C:\Users\user\AppData\Roaming\npm\node_modules目录下。No
2014-05-21 20:38:05 1023
原创 TreeMap内部实现简介
1、概述TreeMap是Java内部实现比较复杂的集合类之一。与HashMap不一样,TreeMap的底层不是用哈希表实现的,而是用红黑树实现的。另外,HashMap存取元素的时间复杂度是O(1)的常量级,而TreeMap对元素的操作复杂度为O(log n)。虽然在操作性能方面,TreeMap不占优势,但是因为它使用红黑树(平衡二叉查找树)实现,所以它内部的元素都是排好序的。当需要查找的元
2014-04-26 17:06:57 1997
原创 LinkedHashMap内部实现
1、概述LinkedHashMap继承自HashMap,它能保证遍历元素时,输出的顺序和输入时的顺序相同。LinkedHashMap不仅实现HashMap的开散列哈希表(数组+链表),还维护着一个运行于所有键值对的双向链接列表。此列表定义了迭代的顺序,该迭代顺序包括插入顺序和访问顺序两种,默认是插入顺序;可以通过设置accessOrder为true,把迭代顺序设置为访问顺序。
2014-04-26 10:54:33 2043
原创 HashMap内部存储实现及HashTable比较
一、HashMap的内部存储实现HashMap底层实现的数据结构是哈希表。哈希表的实现一般有两种,第一种是数组(闭散列),第二种是数组+链表(开散列)。而HashMap采用的是“数组+链表”的实现,即数组存储链表的头结点。1、HashMap存储数据时进行put( key, value )的操作,源代码如下:[java] view plaincopy
2014-04-26 10:00:43 1473
原创 ajax跨域请求jsonp
1、用户访问其他域名服务器时,伪服务器把ajax加入到真实服务器返回的html页面(或js文件);2、用户得到返回的请求后,ajax会自动执行:向伪服务器发送qq空间的请求,得到cookie,伪服务器把cookie中的qq号返回给ajax;3、ajax把qq号设置到该域名的cookie中。//nodejs伪服务器:(host文件:127.0.0.1 user.qz
2014-04-19 17:20:17 748
winutils.exe:解决hadoop在windows运行出现的bug
2014-07-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人