AlvinNoending的专栏

专注改变菜鸟,灵感成就大神

排序:
默认
按更新时间
按访问量

矩阵的秩与行列式的几何意义

作者:曾博 链接:https://zhuanlan.zhihu.com/p/19609459 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 这里首先讨论一个长期以来困惑工科甚至物理系学生的一个数学问题,即,究竟什么是面积,以及面积的高维推广? 1 ...

2017-01-12 17:10:35

阅读数:415

评论数:0

数据挖掘算法学习(八)Adaboost算法

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。Adaboost算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权...

2017-01-03 16:13:23

阅读数:297

评论数:0

统计学习方法笔记 -- 概论

统计学习方法是基于训练数据构建统计模型,从而对数据进行预测和分析。  统计学习分为,监督学习(supervised learning),非监督学习,半监督学习和强化学习(reinforcement learning),其中以监督学习最为常见和重要,所以这里只讨论监督学习 统计学习的过程如下...

2016-12-28 17:31:38

阅读数:355

评论数:0

朴素贝叶斯——详解

机器学习十大算法——朴素贝叶斯

2016-12-10 15:56:11

阅读数:566

评论数:0

朴素贝叶斯——原理浅析和应用

机器学习十大算法——朴素贝叶斯

2016-12-10 15:53:15

阅读数:271

评论数:0

超级好用的流程图js框架

包含各种流程图,可以用于企业业务流程的实现。 网址:http://flowchart.js.org/

2016-10-26 20:00:02

阅读数:24119

评论数:1

数据仓库-易错点

转自:博客园-liuweiqiang2v 最近在搞关于数据分析的项目,做了一点总结。 下图是系统的数据流向。 容易出现错误的地方。 1、数据进入hadoop仓库 有四种来源,这四种是最基本的数据,简称ods,original data source,后续 的数据都是有...

2016-09-08 14:36:58

阅读数:378

评论数:0

Linux网络NAT模式配置

既要NAT内部各个节点能相互ping通,又能ping通外网,如下设置ifc-eth0文件: vi 编辑/etc/sysconfig/network-scripts/ifcfg-eth0文件 DEVICE=eth0 TYPE=Ethernet ONBOOT=yes BOOT...

2016-05-12 22:17:39

阅读数:3267

评论数:0

hive bug

1. hive的insert bug 001,如下: insert overwrite table XXX  partition(dt='2016-04-09') as select  '' as a1 from YYY;    如此得到的表XXX有一个字段,但是这个字段的值并非空字符串,也...

2016-04-09 18:45:48

阅读数:254

评论数:0

java中Map数据结构详解

Map用于保存具有映射关系的数据,Map里保存着两组数据:key和value,它们都可以使任何引用类型的数据,但key不能重复。所以通过指定的key就可以取出对应的value。Map接口定义了如下常用的方法: 1、void clear():删除Map中所以键值对。 2、boolean ...

2015-09-28 11:51:21

阅读数:7974

评论数:4

SolrCloud简介

一.简介 SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。 二.特色功能 SolrCloud有几...

2015-07-01 13:26:37

阅读数:384

评论数:0

Heron(一)—-storm的一些短板

twitter在使用storm过程中发现了一些storm的弊端,开发Herons相对storm需要提升的几个特性:1)更好的扩展性, 2)更容易调试 3)更高的性能  4)更好管理–可以和其他系统复用资源                 storm的短板: 1)storm的...

2015-06-25 18:18:56

阅读数:551

评论数:0

Solr简介

solr在lucene外边做了一层厚厚的封装,主要是为了简化二次开发,提供了一些成熟的解决方案。 solr和solrCore solr可以对多个core进行综合管理,并接受请求选择特定的一个或者多个core执行相关任务。下面来回答什么是solr的core。 core从文件结构的角...

2015-06-25 15:24:38

阅读数:392

评论数:0

JVM参数设置及分析

不管是YGC还是Full GC,GC过程中都会对导致程序运行中中断,正确的选择不同的GC策略,调整JVM、GC的参数,可以极大的减少由于GC工作,而导致的程序运行中断方面的问题,进而适当的提高Java程序的工作效率。但是调整GC是以个极为复杂的过程,由于各个程序具备不同的特点,如:web和GUI程...

2015-06-25 10:20:53

阅读数:401

评论数:0

JVM优化——CMS

CMS,全称Concurrent Low Pause Collector,是jdk1.4后期版本开始引入的新gc算法,在jdk5和jdk6中得到了进一步改进,它的主要适合场景是对响应时间的重要性需求大于对吞吐量的要求,能够承受垃圾回收线程和应用线程共享处理器资源,并且应用中存在比较多的长生命周期的...

2015-06-25 10:10:11

阅读数:357

评论数:0

MapReduce的Shuffle过程介绍

MapReduce的Shuffle过程介绍 Shuffle的本义是洗牌、混洗,把一组有一定规则的数据尽量转换成一组无规则的数据,越随机越好。MapReduce中的Shuffle更像是洗牌的逆过程,把一组无规则的数据尽量转换成一组具有一定规则的数据。 为什么MapReduce计算...

2015-06-08 11:40:40

阅读数:522

评论数:0

Hermes:来自腾讯的实时检索分析平台

Hermes:来自腾讯的实时检索分析平台 实时检索分析平台(Hermes)是腾讯数据平台部为大数据分析业务提供一套实时的、多维的、交互式的查询、统计、分析系统,为各个产品在大数据的统计分析方面提供完整的解决方案,让万级维度、千亿级数据下的秒级统计分析变为现实。    Herme...

2015-06-03 14:27:55

阅读数:1024

评论数:0

Lucene实践:全文检索的基本原理

Lucene实践:全文检索的基本原理  一、总论 根据http://lucene.apache.org/java/docs/index.html 定义: "Apache Lucene(TM) is a high-performance, full-feature...

2015-05-29 17:17:21

阅读数:543

评论数:0

Solr 和 ElasticSearch 对比

实时搜索 elasticsearch vs solr oyhk学习笔记 什么是ElasticSearch? ElasticSearch是基于rest风格,分布式搜索引擎,非常优秀的lucene库.内置的JSON API提供了一个优雅的+ HTTP平台完美的结合(例:弹性可搜索的rub...

2015-05-06 11:58:22

阅读数:10267

评论数:1

Web高并发解决方案

《手把手让你实现开源企业级web高并发解决方案》 (lvs+heartbeat+varnish+nginx+eAccelerator+memcached) 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http:...

2015-03-17 23:17:54

阅读数:2277

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭