往者不可谏,来者犹可追

答案在风中飘摇

人类如何思考

一、人类有好奇心但不是天生的思考者大脑不是设计来思考的,而是设计为避免思考。多数时候,我们是根据经验、记忆来做解决问题或做决定。但这并不是说我们完全避免思考,我们也追求可以自行解决问题,因为这会让我们感到愉悦。前提是这个,问题不是那么难以解决,并且在我们决定要解决它之前,能稍微看到成功的曙光这也解...

2017-08-12 19:53:01

阅读数 1518

评论数 0

NP难问题与过拟合

NP问题一直都是信息学的巅峰。巅峰,意即很引人注目但难以解决。在信息学研究中,这是一个耗费了很多时间和精力也没有解决的终极问题,好比物理学中的大统一和数学中的歌德巴赫猜想等。 以下引用于:什么是P问题、NP问题和NPC问题P类问题的概念:如果一个问题可以找到一个能在多项式的时间里解决它的算法,那么...

2017-08-01 23:51:55

阅读数 641

评论数 0

XGBoost 与 Boosted Tree 原理

这篇文章是XGBoost的作者——陈天奇大神对XGBoost原理的解析,文章脉络十分清晰,环环相扣,每个部分都列举了对应的例子,帮助我们更好的理解原文,看完收获良多。1、有监督学习算法的逻辑组成要讲boosted tree,要先从有监督学习讲起。在有监督学习里面有几个逻辑上的重要组成部件,初略地分...

2017-07-25 18:43:53

阅读数 535

评论数 0

Alphago原理浅析

1、深度强化学习 强化学习是受到生物能够有适应环境的启发,以试错的机制与环境进行交互,通过最大化累积奖赏的方式来学习最优策略。而深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输 入的图像进行控制,是一种更接近人类思维方式的人工智能方法。   2、蒙卡罗特树 蒙特...

2017-06-30 19:55:06

阅读数 1039

评论数 0

过拟合(原因、解决方案、原理)

1.定义 标准定义:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比h’小,但在整个实例分布上h’比h的错误率小,那么就说假设h过度拟合训练数据。 2.出现过拟合的一些原因 (1)建模样本抽取错误,包括(但不限于)样本数...

2017-09-27 18:32:41

阅读数 280

评论数 0

AUC计算方法总结

一、roc曲线 1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。 横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Spec...

2017-09-24 16:44:30

阅读数 178

评论数 0

Bagging和Boosting 概念及区别

Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。 首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。 1、Ba...

2017-09-22 21:42:44

阅读数 187

评论数 0

多分类问题中的交叉熵

熵的本质是香农信息量()的期望。 现有关于样本集的2个概率分布p和q,其中p为真实分布,q非真实分布。按照真实分布p来衡量识别一个样本的所需要的编码长度的期望(即平均编码长度)为:H(p)=。如果使用错误分布q来表示来自真实分布p的平均编码长度,则应该是:H(p,q)=。因为用q来编码的样本来自...

2017-09-22 20:23:08

阅读数 7106

评论数 0

为什么L1正则项会产生稀疏解

Consider the vector x⃗ =(1,ε)∈R2 where ε>0 is small. The l1 and l2 norms of x⃗ , respectively, are given by ||x⃗ ||1=1+ε,  ||x⃗ ||22=...

2017-09-22 19:45:33

阅读数 593

评论数 0

Java中的static关键字解析

一.static关键字的用途   在《Java编程思想》P86页有这样一段话:   “static方法就是没有this的方法。在static方法内部不能调用非静态方法,反过来是可以的。而且可以在没有创建任何对象的前提下,仅仅通过类本身来调用static方法。这实际上正是static方法的主要用...

2017-09-18 08:41:10

阅读数 781

评论数 0

Java多线程和线程池

1.为什么要使用线程池 在java中,如果每个请求到达就创建一个新线程,开销是相当大的。在实际使用中,服务器在创建和销毁线程上花费的时间和消耗的系统资源都相当大,甚至可能要比在处理实际的用户请求的时间和资源要多的多。除了创建和销毁线程的开销之外,活动的线程也需要消耗系统资源。如果在一个jvm...

2017-09-15 11:55:14

阅读数 163

评论数 0

Java中hashCode的作用

以下是关于HashCode的官方文档定义: hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。       hashCode 的常规协定是:    在 Java 应用程序执行期间,在同一对...

2017-09-15 11:07:28

阅读数 173

评论数 0

HashMap、HashTable异同

1、HashMap是非线程安全的,HashTable是线程安全的。 2、HashMap的键和值都允许有null值存在,而HashTable则不行。 3、因为线程安全的问题,HashMap效率比HashTable的要高。 一、HashMap的内部存储结构 Java中数据存储方式最...

2017-09-14 22:49:35

阅读数 150

评论数 0

集合类以及集合框架

集合是一组复合元素的容器,用来存储,检索,控制聚合数据并提供它们之间的通信方法。 java的集合框架提供了表示和操控集合的统一架构。所有的集合框架都包含下面三个方面: 接口:即集合的抽象数据结构。接口允许我们独立地操纵集合而不用考虑集合的具体实现 实现:即接口的具体实现类。从本质上来讲...

2017-09-14 22:37:24

阅读数 863

评论数 1

深度学习入门

人工智能(AI)是近两年来最热门的词之一了,自16年Google DeepMind的AlphaGo打败了世界围棋大师李世石后,人们在惊叹之余,也意识到人工智能时代的正式开始。从此,人工智能、机器学习和深度学习就成为了热门词汇,而它们的关系如下图1所示。 人工智能的概念起源于195...

2017-09-14 13:26:50

阅读数 5971

评论数 0

浅析数据一致性

什么是数据一致性?   在数据有多分副本的情况下,如果网络、服务器或者软件出现故障,会导致部分副本写入成功,部分副本写入失败。这就造成各个副本之间的数据不一致,数据内容冲突。 实践中,导致数据不一致的情况有很多种,表现样式也多种多样,比如数据更新返回操作失败,事实上数据在存储服务器已经更新成...

2017-09-12 17:26:50

阅读数 201

评论数 0

迷宫寻路

问题描述: 假设一个探险家被困在了地底的迷宫之中,要从当前位置开始找到一条通往迷宫出口的路径。迷宫可以用一个二维矩阵组成,有的部分是墙,有的部分是路。迷宫之中有的路上还有门,每扇门都在迷宫的某个地方有与之匹配的钥匙,只有先拿到钥匙才能打开门。请设计一个算法,帮助探险家找到脱困的最短路径。如前所...

2017-09-08 15:06:02

阅读数 472

评论数 0

HDFS Federation

1. 当前HDFS架构和功能概述 我们先回顾一下HDFS功能。HDFS实际上具有两个功能:命名空间管理(Namespace management)和块/存储管理服务(block/storage management)。 1.1 命名空间管理 HDFS的命名空间包含目录、文件和块。命名空间管...

2017-09-02 20:13:32

阅读数 193

评论数 0

LFU缓存策略

Example: LFUCache cache = new LFUCache( 2 /* capacity */ ); cache.put(1, 1); cache.put(2, 2); cache.get(1); // returns 1 cache.put(3, 3); /...

2017-08-30 21:17:05

阅读数 313

评论数 0

LRU缓存策略

问题描述: 为最近最少使用(LRU)缓存策略设计一个数据结构,它应该支持以下操作:获取数据(get)和写入数据(set)。 获取数据get(key):如果缓存中存在key,则获取其数据值(通常是正数),否则返回-1。 写入数据set(key, value):如果key还没有在缓存中,则写入其...

2017-08-29 19:48:35

阅读数 183

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭