自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(165)
  • 收藏
  • 关注

原创 js原型

原型是个很微妙的东西,很多人不是很理解,理解了原型对于研究其他js类的框架(比方Extjs)很有帮助.   下面我们开始讨论下原型,对于理解js中的原型概念十分重要。简单来说,一个原型类似其他语言中的一个类,它定义的属性且可以被此类产生的所有对象所共享。然后它又不像一个类,原型可以在运行时获得和改变。可以增加属性到原型上或者删除原型上已经存在的属性。所有的变化将立即影响由原型派生的对象。它是如...

2012-07-26 09:12:23 153

原创 solr服务器复制、服务器分发(shard)、Multicore(分片)配置,SolrJ的使用

Solr服务器复制的配置1,首先测试在本机上开启三个tomcat的服务器:一个端口是80,另一个是98882,按照标题一的配置对第二和第三个tomcat服务器进行类似的配置,注意SolrHome的目录不要相同即可,其他的配置不变. 例如:以本机为例tomcat命名     URLSolrHome目录URI      web.xml配置...

2012-07-16 15:23:39 502

原创 Solr Replication(复制)是怎样工作的

        luence有一个IndexDeletePolicy接口,这个接口是提供luence删除索引文件的两个时机,分别是init和commit,init是在IndexWirter创建时执行的。commit是在有索引文件更新,提交是执行的。而indexDeletePolicy这两个方法都会得到一个提交点集合即(IndexCommit),IndexCommit是luence的一个抽...

2012-07-16 15:18:23 163

原创 Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索

   原文出处:http://blog.chenlb.com/2009/01/solr-multicore-work-with-solr-distributed-searching-to-search-big-index.html (系列博文,大牛!) Solr Distributed Searching (分布式搜索) 是 solr 1.3 的特性。大索引,可能有多种原因...

2012-07-13 17:58:11 96

原创 solr学习资料收集

      学习新东西前,我一般都会先找些文章来看,整个原理呀、执行过程呀、优缺点呀之类的先了解个大概。然后建个工程开始写例子,在写例子的过程中还会查找些资料,比如百度文库上比较有价值的文档等,只是有些豆豆要的比较多,有点坑爹。在写例子的过程中不断的完善,封装,直到把代码写的看的下去,然后跑通整个过程。前面的那篇solrj的二次开发就主要是对solr的客户端API进行了封装,使之适合自己的使用。总...

2012-07-13 17:57:50 102

原创 Searching过程详解

1.拦截请求,解析请求并构建相应的handler。发送检索请求,例如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on首先他将被SolrDispatchFilter拦截。?doFilter(Ser...

2012-07-11 11:41:20 729

原创 solr的配置参数理解

l  dataDir参数用于替换默认的索引数据目录(./data)。如果重复指定,将使用重复的值。如果不是绝对路径,将使用servlet容器当前工作目录下的相对路径。<dataDir>/var/data/solr</dataDir> l  mainIndex参数部分mainIndex>    <!-- lucene opt...

2012-07-11 11:35:12 197

原创 DataImportHandler从数据库导入大量数据而内存溢出的问题

   Solr有个很方便的处理器叫DataImportHandler,可以通过配置配置db-data-config.xml配置各种数据源然后从中导入数据进行索引,很方便我们进行开发.但是之前从数据库导入数据一直有个问题,就是如果数据库中数据过大,就会导致内存溢出.自己经过阅读源码以及发邮件到Solr邮件列表,终于找到了解决办法,这里拿出来共享.      这里我的Solr版本是Solr1.4....

2012-07-11 11:33:23 168

原创 Solr 3.5 + Tomcat7 + mmseg4j + 搜狗词库 -配置并运行

这是我看到过的写的较好的一篇入门文章,个人觉得相对有些文章来说靠谱些,呵呵。机器上已安装 : Tomcat 7    jdk1.7    mysql 5.0访问 http://www.apache.org/dyn/closer.cgi/lucene/solr , 在这个网址里选择一个路径 , 下载 solr 3.5 的版本solr3.5 在本机解压缩以后 , 把 apache-s...

2012-07-11 11:22:56 59

原创 solrj之二次开发

Solrj已经是很强大的solr客户端了。它本身就包装了httpCliet,以完全对象的方式对solr进行交互。很小很好很强大。下面直接上自己封装的主要代码:1、solrj操作接口 public interface SolrjQuery {       // solrj查询返回SolrDocument记录的集合 public DataGrid<SolrD...

2012-07-11 11:19:50 116

原创 spring AOP

先简单的说说spring aop使用的好处:利用AOP横向添加的进去的功能一般与主体业务无关,且复用性高。例如日志记录,性能统计,安全控制,事务处理,异常处理等。将这些比较公用的逻辑从业务主逻辑代码中划分出来,通过分离,我们可以将它们独立到非主导业务逻辑的单独方法中。 这样就把与对业务逻辑无关的逻辑部分进行隔离,从而改变这些行为的时候不影响业务逻辑的代码。使得业务逻辑各部分之间的耦合度降低,提高程...

2012-06-13 11:14:00 87

原创 spring IOC的使用

 Ioc和他的作用,简单的来讲,就是由容器控制程序之间的关系,而不是由我们手动编写控制实现中,由程序代码直接操控。这也就是所谓“控制反转”的概念所在:控制权由应用代码中转到了外部容器,控制权的转移,是所谓反转。下面通过添加用户的小例子具体来看,首先配置Spring的环境1、加入spring的依赖包(1).SPRING_HOME/dist/spring.jar(2).SPRING...

2012-06-13 10:58:08 75

原创 spring IOC介绍

      首先想说说IoC(Inversion of Control,控制倒转)。这是spring的核心,贯穿始终。      所谓IoC,对于spring框架来说,就是由spring来负责控制对象的生命周期和对象间的关系。这是什么意思呢,举个简单的例子,我们是如何找女朋友的?常见的情况是,我们到处去看哪里有长得漂亮身材又好的mm,然后打听她们的兴趣爱好、qq号、电话号、ip号、iq号...

2012-06-13 10:55:15 80

原创 spring概述

随着越来越多的项目使用到spring框架,觉得很有必要重新细致的梳理整理spring相关知识。Spring是什么?Spring是一个开源框架,是为了解决企业应用程序开发复杂性而开发的。从简单性、可测试性和松耦合的角度而言,任何Java应用都可以从Spring中受益。简单来说,Spring就是一个轻量级的控制反转(IoC)和面向切面(AOP)的容器框架。下面从整体上认识一下S...

2012-06-13 10:52:48 65

原创 利用google map给网站加上地图标识

要想在自己的网站上用google地图展示出地址,就的用到 google map api,如下,其中address是最重要的,Java代码  <script src="http://maps.google.com/maps?file=api&v=2&key=${mapkey()}"        type="...

2012-06-05 17:45:43 171

原创 解析网页利器组合(正则、jsoup、beanshell、dozer)资源

由于项目需要使用java正则、jsoup、dozer、beanshell组合用来解析网页,现把相关资源整理记录: dozer : 基于beanUtils实现的对象转化工具,实现各种类型之间对象的深层次复制。beanshell : 一种完全符合java语法的松散类型的脚本语言,可以用来完成简单或复杂对象的逻辑判断。dozer和beanshell之前接触的少,需要的话网上找资料,...

2012-05-31 16:09:45 140

原创 Java正则表达式(二)

Matcher类: 使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的. 下面我们看看一个小例子,来说明这个问题 引用\w(\d\d)(\w+)这个正则表达式有三个组: 整个...

2012-05-31 15:47:39 73

原创 Java正则表达式(一)

正则表达式在处理文本方面用处非常大,最早像在Perl和awk语言中,提供了这种机制,Java在Java 2中也增加了正则表达式这个包java.util.regex。这个包为用户使用正则表达式,提供了易用而全面的支持。我的研究方向是web挖掘。从网页中提取内容,处理文本,当然需要正则表达式这个强大的工具了。 一、首先我们看一下怎么使用正则表达式的一个例子: A Matcher exa...

2012-05-31 15:46:41 73

原创 Java正则表达式详解

如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达...

2012-05-31 15:45:19 64

原创 SOLR搭建企业搜索平台

一、SOLR搭建企业搜索平台--MultiCore Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。 我们知道你既可以把不同类型的数据放到同一index中,也可以使用分开的多indexes。基于这一点,你只需知道如何使用多 indexes(实际上就是运行Solr的多实例)。尽管如此,为每一个类型添加一个完整的Solr实例会显得太臃肿庞大。S...

2012-05-24 18:34:38 171

原创 solr理论

1、 solr基础因为 Solr 包装并扩展了 Lucene,所以它们使用很多相同的术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。在 Solr 和 Lucene 中,使用一个或多个 Document 来构建索引。Document...

2012-05-24 17:11:21 342

原创 solr中Schema.xml和solrconfig.xml分析

一、字段配置(schema)schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个FieldType的名称。cl...

2012-05-24 17:09:28 54

原创 solr部署

1,从官方网站下载solr:apache-solr-3.4.0.zip2,解压已经下载的文件后如下所示Xml代码  E:\jar\solr\apache-solr-3.4.0\example\solr    3,把 apache-solr-3.4.0\example\webapps\solr.war 解压复制到 D:\To...

2012-05-21 18:45:59 61

原创 hadoop shell操作与程式开发

见附件~

2012-05-09 11:24:45 62

原创 MapReduce中的Shuffle和Sort分析

         MapReduce 是现今一个非常流行的分布式计算框架,它被设计用于并行计算海量数据。第一个提出该技术框架的是Google 公司,而Google 的灵感则来自于函数式编程语言,如LISP,Scheme,ML 等。         MapReduce 框架的核心步骤主要分两部分:Map 和Reduce。当你向MapReduce 框架提交一个计算作业时,它会首先把计算作业拆分...

2012-05-08 15:01:07 202

原创 Hadoop平台在云计算上的应用

 1 Hadoop 介绍      Hadoop是由Apache 开源组织的一个分布式计算框架,可以在大量廉价的硬件设备组成的集群上运行应用程序,为应用程序提供了一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统。Hadoop 的主要优点[3] 有:扩容能力强、成本低廉、效率高、高可靠性、免费开源及良好的可移植性。      Hadoop 集群是典型的Master/S...

2012-05-07 17:44:42 334

原创 Hadoop介绍及运行wordcount实例

     Hadoop 是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员。      HDFS 是Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB 级)的大文件(通常超过64M),其原理采用Master/S...

2012-05-05 14:04:29 119

原创 lucene检索运算符

lucene检索运算符:1. “:” 指定字段查指定值,如返回所有值*:*2. “?” 表示单个任意字符的通配3. “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)4. “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。5. 邻近检索,如检索相隔10个单词的”...

2012-05-05 13:05:21 99

原创 Ubuntu11.10下安装Hadoop环境(单机伪分布式)

安装ssh1apt-get install ssh安装rsync1apt-get install rsync配置ssh免密码登录(因为是单机伪分布式模式,所以仅需检查一下机器是否对自己运行ssh)1ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa...

2012-04-28 09:47:42 74

原创 网站日志代码

 做位一名SEO工作者,网站日志和对日志代码的了解是比较基础的,很多时候我们会从中间发现或分析一些现象,这对于网站的发展进度和以后的操作流 程,乃至网站下一步情况的预测,都是非常有帮助的,下面我们将网站日志及其中的HTTP状态码说明下,希望能解决一些在SEO工作中遇见的常见问题。网站日志是什么?网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文...

2012-03-21 11:20:38 591

原创 一个基于jquery的banner轮播

一个banner轮播广告。JavaScript代码<script type="text/javascript" src="http://www.dabaii.com/demo/20100907/js/jquery.js"></script>   <script type="text/javascri...

2012-03-21 10:21:34 107

原创 jquery要怎么写才能速度最快?(转)

很久没有关注jQuery了,最近重新看了一下,看到一些不错的文章,转来坐一下笔记。其内容和一些新提供的方法还是很多有值得学习的地方。 1. 使用最新版本的jQuery jQuery的版本更新很快,你应该总是使用最新的版本。因为新版本会改进性能,还有很多新功能。下面就来看看,不同版本的jQuery性能差异有多大。这里是三条最常见的jQuery选择语句:  $('.el...

2012-03-21 09:52:31 71

原创 Apache 负载均衡+Tomcat集群(测试)

 一、本机环境1.Windows 7 64位操作系统2.java版本 "1.6.0_20"3.Apache安装包httpd-2.2.21-win32-x86-no_ssl.msi,默认安装4.tomcat压缩包(apache-tomcat-6.0.24.zip)5.在一台机器上进行的 二、配置1.前提是Apache安装正确,启动正常 2.解压缩多个tom...

2012-01-15 10:17:30 77

原创 nginx提升网站访问速度

Nginx 简介Nginx ("engine x") 是一个高性能的 HTTP 和 反向代理 服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,它已经在该站点运行超过两年半了。 Igor 将源代码以类 BSD 许可证的形式发布。尽管还是测试版,但是,Nginx 已经因为它的稳定性、...

2012-01-13 12:00:22 311

原创 nginx笔记三

1.利用全局变量$args。    下面的代码是在调用URL中参数s的值    例如:www.google.com?id=10&s=020&wan=009    这里就是直接取得s的值020.Conf代码  server {      listen 81;      server_name  127.0.0.1;  #过滤参数  ...

2012-01-13 11:20:31 61

原创 nginx笔记二

rewrite是通过正则表达式来改变uri的功能,如何重定向和选择配置文件,是由变量决定的       如果这个指令在server层级,那么它将在请求的location被确定之前就被执行。如果在那个location中,也设定了rewrite指令,那么指令仍旧会执行。如果location内部的rewrite指令执行后,uri改变了,那么新的uri的location会被重新计算,这个循环执行1...

2012-01-13 11:18:03 61

原创 nginx笔记一

1.nginx的基本作用 2.选择nginx的理由a)         支持 5w 的并发。b)        内存消耗少。c)         成本低。d)        节省带宽(??)。e)         配置简单,支持重写( Rewrite ),内置健康检查,热部署,稳定性高。 3.nginx中location模块的详细参数介绍Nginx的Lo...

2012-01-13 10:12:49 75

原创 linux知识集锦

原贴:http://blog.chinaunix.net/u/21012/showart_143614.htmllinux常用命令一份转自:http://www.linuxsir.org 超级多的linux镜象下载(续集),泣血推荐。 地址是: http://mirror.vmmatrix.netlinux常用命令一份最常用的基本操作命令[推荐篇]http://www.l...

2012-01-11 14:02:52 113

原创 tomcat server.xml详解

Tomcat Server的结构图                   该文件描述了如何启动Tomcat Server <Server>    <Listener />    <GlobaNamingResources>    </GlobaNamingResources    <Service>        <Connect...

2012-01-11 11:55:28 67

原创 理解String与String.intern()

      1. 首先String不属于8种基本数据类型,String是一个对象。   因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性。   2. new String()和new String(“”)都是申明一个新的空字符串,是空串不是null;   3. String str=”kvill”;...

2012-01-05 15:44:36 67

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除