自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Spring , Hadoop, Spark , BI , ML

Later equals never.

  • 博客(15)
  • 资源 (2)
  • 收藏
  • 关注

原创 Php defined or

经常在一些代码中看到defined or的组合,例如:defined('MyPath') or define('MyPath' , __DIR__.'/');defined('MyPath') || define('MyPath' , __DIR__.'/');分析一下,左边的defined用于判断一个常量是否定义,返回boolean; 右边的define定义常量,返回是否成功。 or或者||

2016-08-26 17:57:43 2037

原创 Php引用

1、What Reference ArePHP中的引用,用于使用不同的名字来访问同一个变量内容。引用不像C语言中的指针,不是具体的内存地址,不能进行指针的算术运算。引用只是symbol table alias。2、What Reference Do引用主要用在3个地方:assigning by reference <?php $a =& $b; ?>这个赋值语句运行之后,a和b

2016-08-26 17:02:47 2239

原创 Window下安装php composer

composer是一个php的依赖管理工具,类似JVM环境中的maven,虽然mave的功能比composer强大得多。官方指南:https://getcomposer.org/doc/00-intro.md下载exe:https://getcomposer.org/Composer-Setup.exe安装时由于php没有安装openssl扩展,出现如下问题:解决方案:修改php.ini,取消以下2

2016-08-25 00:30:15 734

原创 MySQL JDBC表情编码配置

在MySQL中,表情符号需要4个字节的空间存储,因此如果某个列需要兼容表情存储,需要设置该列的字符集为utf8mb4:ALTER TABLE `db`.`tablename` CHANGE COLUMN `content` `content` VARCHAR(45) CHARACTER SET 'utf8mb4' NULL DEFAULT NULL COMMENT '' ;另外,根据Mysql的文

2016-08-24 09:16:08 1591

原创 Java Bean相关工具类库

JavaBeans规范移步这里。JDK自动的基础工具:java.lanf.reflect和java.beans包Apache Common BeanUtils:项目 主页项目 文档 Spring框架的相关工具类:org.springframework.beans.BeanUtilsDozer:Bean-Bean映射 Dozer is a Java Bean to Java Bean map

2016-08-22 18:15:32 890

原创 ElasticSearch位置搜索

在ElasticSearch中,地理位置通过geo_point这个数据类型来支持。地理位置的数据需要提供经纬度信息,当经纬度不合法时,ES会拒绝新增文档。这种类型的数据支持距离计算,范围查询等。在底层,索引使用Geohash实现。1、创建索引PUT创建一个索引cn_large_cities,mapping为city:{ "mappings": { "city": {

2016-08-19 19:02:01 7833

转载 MySQL和Lucene索引对比分析

MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr、ElasticSearch)的核心类库。两者的索引(index)有什么区别呢?以前写过一篇《Solr与MySQL查询性能对比》,只是简单的对比了下查询性能,对于内部原理却没有解释,本文简单分析下两者的索引区别。1. MySQL索引实现在MySQL中,索引属于存储引擎级别的概念,不同存储引

2016-08-13 23:32:31 2293

原创 Solr分面搜索(Faceting)

分面搜索(Faceting)基于索引词项对搜索结果进行分类,同时返回每个分类对应的文档数。用户可以可以分类缩小结果范围。下图是一个结果汇总的例子:Amazon的搜索也提供了非常优秀的分面及相应的过滤:环境Solr的发行版自带了一些很好的例子,使用这些例子研究Solr的各种特性非常合适。我们这里使用Solr自带的techproducts索引作为例子。启动solr:solr -e techproduct

2016-08-13 14:54:13 1937

原创 模糊匹配及Solr关键词自动提示应用

1. 字符串相似度字符串相似度用于衡量2个字符串之间的相似度,这里的相似度一般指形式上的相似,而非语义上的相似。字符串相似度算法是模糊字符串匹配(搜索)的核心内容之一,在搜索引擎中的拼写检查、关键词智能补全中也发挥重要重要。在更高层次的实体链接(识别)或实体消歧应用中,也是重要的研究内容。 字符串的模糊匹配也叫模糊匹配,有点类似于正则表达式匹配,但是存在一些不同。字符串匹配(正则表达式)通常关注精

2016-08-13 10:32:41 5913 1

原创 Solr基本概念

搜索基本构成搜索的基本定义,可以表述为以下4个步骤:1) 构建索引: Indexing,对文件、网站、数据库的记录进行处理以便可以进行搜索,被索引的文件称为文档。 构建索引之前,需要对文档的内容、结构、类型深入了解,这对于构建索引很有必要,对内容不理解,很难构建出优秀的搜索引擎。索引是使得文档可搜索的过程,一般是将文档各部分内容切分成词条(token),词条经过词干还原、不区分大小写等方式进行

2016-08-11 23:33:50 1949

原创 Spark及其子项目

Apache Spark是一个通用的分布式计算框架,基于内存的特点使得其以高性能著称。Spark应用可以运行在本地模式或者集群模式,集群模式中通过ClusterManager来管理整个应用,目前Spark提供了3中Cluster Manager:Standalone,Mesos,YARN。除了核心的计算引擎Spark Core以外,Spark还有一系列相关的项目:Spark CoreSpark Co

2016-08-07 19:38:48 2426 5

原创 ZooKeeper集群搭建详细步骤

Apache ZooKeeper是一个非常出色的分布式协调系统,在配置管理、命名服务、分布式同步等方面应用广泛。其基本思想来源于Google的Chubby,可以认为是其开源实现。在Hadoop生态系统中,ZooKeeper发挥着非常作用的作用,kafka等很多系统都依赖于ZooKeeper提供服务。ZooKeeper通过选举产生一个Leader,其他节点作为Follower。Leader发生故障时会

2016-08-05 00:28:55 1713

原创 Hue 3.9 Tarball安装及界面一览

Hue是Cloudera开源的一个Hadoop UI,由Cloudera Desktop演化而来。面向用户提供方便的UI用于平时的Hadoop操作中。Apache Ambari面向的是管理员,用于安装、维护集群,而不是使用集群。两者针对的是不同需求。Hue安装:本文环境配置如下:OS: CentOS 6.6 FinalHadoop: 2.6.0Hue 3.9官网教程:http://gethu

2016-08-03 06:16:04 2032

原创 HBase分布式集群搭建

本文详细介绍搭建分布式HBase集群的步骤,并给出一个简单的例子。假设在集群上已经安装好JDK以及HDFS,如果还未安装,请参考这篇详细的Hadoop集群搭建步骤。HBase集群组成HBase采用主从模式,由Master和RegionServer组成,使用ZooKeeper作为协调服务。集群个角色如下:下面我们搭建的集群由3个节点组成,一台作为Master,另外两台作为RegionServer。Zo

2016-08-02 21:53:08 1348

原创 Hadoop中的几种文件格式

Hadoop中的文件格式大致上分为面向行和面向列两类:面向行:同一行的数据存储在一起,即连续存储。SequenceFile,MapFile,Avro Datafile。采用这种方式,如果只需要访问行的一小部分数据,亦需要将整行读入内存,推迟序列化一定程度上可以缓解这个问题,但是从磁盘读取整行数据的开销却无法避免。面向行的存储适合于整行数据需要同时处理的情况。面向列:整个文件被切割为若干列数据,每

2016-08-01 19:50:28 21477

买年费Gif制作工具,支持录屏、录像,强大的编辑功能

免费并且功能强大的gif制作,编辑工具。支持录屏,摄像头录像等方式。并且编辑功能非常强大,中文支持。

2016-07-06

Rc振荡器课件

RC振荡器课件RC振荡器课件RC振荡器课件RC振荡器课件RC振荡器课件

2012-11-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除