关闭

矩阵的秩与行列式的几何意义

作者:曾博 链接:https://zhuanlan.zhihu.com/p/19609459 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 这里首先讨论一个长期以来困惑工科甚至物理系学生的一个数学问题,即,究竟什么是面积,以及面积的高维推广? 1 关于面积:一种映射 大家会说,面积,不就是长乘以宽么,其实不然。我们首先明确,这里所讨论的面积,是欧...
阅读(309) 评论(0)

数据挖掘算法学习(八)Adaboost算法

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。Adaboost算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次得到的分类器最后融合起来,作为最后的决策分...
阅读(230) 评论(0)

统计学习方法笔记 -- 概论

统计学习方法是基于训练数据构建统计模型,从而对数据进行预测和分析。  统计学习分为,监督学习(supervised learning),非监督学习,半监督学习和强化学习(reinforcement learning),其中以监督学习最为常见和重要,所以这里只讨论监督学习 统计学习的过程如下,  1. 获取训练数据集合  2. 确定假设空间,即所有可能的模型的集合  3. 确定模型选择...
阅读(268) 评论(0)

朴素贝叶斯——详解

机器学习十大算法——朴素贝叶斯...
阅读(364) 评论(0)

朴素贝叶斯——原理浅析和应用

机器学习十大算法——朴素贝叶斯...
阅读(194) 评论(0)

超级好用的流程图js框架

包含各种流程图,可以用于企业业务流程的实现。 网址:http://flowchart.js.org/...
阅读(10229) 评论(0)

数据仓库-易错点

转自:博客园-liuweiqiang2v 最近在搞关于数据分析的项目,做了一点总结。 下图是系统的数据流向。 容易出现错误的地方。 1、数据进入hadoop仓库 有四种来源,这四种是最基本的数据,简称ods,original data source,后续 的数据都是有这些组合而来 a、日志文件 b、http接口 c、DB查询 d、建表指向 最后数据都是以ha...
阅读(305) 评论(0)

Linux网络NAT模式配置

既要NAT内部各个节点能相互ping通,又能ping通外网,如下设置ifc-eth0文件: vi 编辑/etc/sysconfig/network-scripts/ifcfg-eth0文件 DEVICE=eth0 TYPE=Ethernet ONBOOT=yes BOOTPROTO=static IPADDR=192.168.200.128 NETMASK=255.2...
阅读(1700) 评论(0)

hive bug

1. hive的insert bug 001,如下: insert overwrite table XXX  partition(dt='2016-04-09') as select  '' as a1 from YYY;    如此得到的表XXX有一个字段,但是这个字段的值并非空字符串,也就是('’),而是null。但是使用create  select 不会出现。这个bug已经再新版本得到...
阅读(210) 评论(0)

java中Map数据结构详解

Map用于保存具有映射关系的数据,Map里保存着两组数据:key和value,它们都可以使任何引用类型的数据,但key不能重复。所以通过指定的key就可以取出对应的value。Map接口定义了如下常用的方法: 1、void clear():删除Map中所以键值对。 2、boolean containsKey(Object key):查询Map中是否包含指定key,如果包含则返回true...
阅读(5121) 评论(1)

SolrCloud简介

一.简介 SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。 二.特色功能 SolrCloud有几个特色功能: 集中式的配置信息使用ZK进行集中配置。启动时可以指定把Solr的相关配置文件上传Z...
阅读(359) 评论(0)

Heron(一)—-storm的一些短板

twitter在使用storm过程中发现了一些storm的弊端,开发Herons相对storm需要提升的几个特性:1)更好的扩展性, 2)更容易调试 3)更高的性能  4)更好管理–可以和其他系统复用资源                 storm的短板: 1)storm的worker调度策略非常复杂,一台机器上的多个worker由操作系统调度,worker中的每个exec...
阅读(521) 评论(0)

Solr简介

solr在lucene外边做了一层厚厚的封装,主要是为了简化二次开发,提供了一些成熟的解决方案。 solr和solrCore solr可以对多个core进行综合管理,并接受请求选择特定的一个或者多个core执行相关任务。下面来回答什么是solr的core。 core从文件结构的角度来看的话,主要包括一份索引(也可能还包括拼写检查的索引)、一堆配置文件。最主要的配置文件是:solr...
阅读(358) 评论(0)

JVM参数设置及分析

不管是YGC还是Full GC,GC过程中都会对导致程序运行中中断,正确的选择不同的GC策略,调整JVM、GC的参数,可以极大的减少由于GC工作,而导致的程序运行中断方面的问题,进而适当的提高Java程序的工作效率。但是调整GC是以个极为复杂的过程,由于各个程序具备不同的特点,如:web和GUI程序就有很大区别(Web可以适当的停顿,但GUI停顿是客户无法接受的),而且由于跑在各个机器上的配置不同...
阅读(338) 评论(0)

JVM优化——CMS

CMS,全称Concurrent Low Pause Collector,是jdk1.4后期版本开始引入的新gc算法,在jdk5和jdk6中得到了进一步改进,它的主要适合场景是对响应时间的重要性需求大于对吞吐量的要求,能够承受垃圾回收线程和应用线程共享处理器资源,并且应用中存在比较多的长生命周期的对象的应用。CMS是用于对tenured generation的回收,也就是年老代的回收,目标是尽...
阅读(301) 评论(0)
101条 共7页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:111742次
    • 积分:1550
    • 等级:
    • 排名:千里之外
    • 原创:32篇
    • 转载:69篇
    • 译文:0篇
    • 评论:5条
    最新评论