自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 资源 (8)
  • 收藏
  • 关注

原创 安居客新建表必须回答DBA的5个问题(DBRT规范)

1. 预计该表每天的数据写入量?2. 预计该表每天的数据查询次数?3. 该表是否用于关键页面(如anjuke.com访问量排名前三的页面,爱房,金铺与好租可先不回答这个问题)   My_Member_BrokerPropManagePage(我的经纪人房源管理)   View_Property_ViewPropSalePage (出售房源单页)   Listing_Proper

2012-10-29 19:24:32 744

转载 网站架构(页面静态化,图片服务器分离,负载均衡)方案全解析

1、HTML静态化    其实大家都知道,效率最高、消耗最小的就是纯静态化的html页面,所以我们尽可能使我们的网站上的页面采用静态页面来实现,这个最简单的方法其实也是最有效的方法。但是对于大量内容并且频繁更新的网站,我们无法全部手动去挨个实现,于是出现了我们常见的信息发布系统CMS,像我们常访问的各个门户站点的新闻频道,甚至他们的其他频道,都是通过信息发布系统来管理和实现的,信息发布系统可以

2012-10-28 17:16:48 1398

原创 CXF入门

1.CXF是基于JAX-WS实现的,JAX-WS规范是一组XML web services的JAVA API,它使用户无需编写复杂的SOAP ENV,WSDL。在 JAX-WS中,一个远程调用可以转换为一个基于XML的协议例如SOAP。在使用JAX-WS过程中,开发者不需要编写任何生成和处理SOAP消息的代码。JAX-WS的运行时实现会将这些API的调用转换成为对于SOAP消息。在服务器端,用

2012-10-19 14:01:42 353

原创 衡量一个优秀系统的标准(工作总结)

各位:                   最近我们在开发一些项目过程中,或多或少都遇到了一些大大小小的问题,这些问题涉及多个项目,比如PPC、支付中心等等,也涉及到各个组许多同事。                   这几天我一直在想这些问题为何会发生?是因为我们做事不认真或者是我们的能力本身就不够??再或者是这些问题本身属于不可抗力非人力所能做好?

2012-10-15 10:02:35 1906

转载 Lucene学习总结之七:Lucene搜索过程解析(3)

2.3、QueryParser解析查询语句生成查询对象代码为:QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "contents", new StandardAnalyzer(Version.LUCENE_CURRENT));Query query = parser.parse("+(+app

2012-10-12 20:21:56 443

转载 Explanation---lucene中对于评分细节描述的类

一般通过IndexSearch.explain(query,docId)----》weight.explain(reader, doc) 方法得到一个文档的评分的具体信息 。Explanation的信息如下:4.803122 = (MATCH) fieldWeight(keywords:奶粉 in 457), product of: 2.0 = tf(termFreq(keywords

2012-10-12 20:19:40 1020

转载 MultiTermQuery查询、FuzzyQuery查询(重要)

MultiTermQuery查询、FuzzyQuery查询关于MultiTermQuery查询。这里研究FuzzyQuery查询。MultiTermQuery是一个抽象类,继承自它的一种有3个,分别为:FuzzyQuery、WildcardQuery、RegexQuery,其中RegexQuery使用了第三方提供的服务,可以使用正则表达式,如果你对正则表达式很熟悉,可以尝试着使用R

2012-10-12 17:32:24 4688

转载 对Lucene PhraseQuery的slop的理解(转载)

这几天看Lucene,看到检索那块,被PhraseQuery折腾了一阵,那本《Lucene In Action》里的代码版本太旧了,也不知是翻译的问题还是我的理解问题,总之在看PhraseQuery的设置slop时费了半天劲,不过,总算是搞明白了,发个帖子来分享一下:    所谓PhraseQuery,就是通过短语来检索,比如我想查“big car”这个短语,那么如果待匹配的document的

2012-10-12 11:47:18 487

原创 java开发中必用的一些东西

1.Junit2.Log4j3.Dom4j4.apache Lang工具包5.Memcached6.RabbitMQ/ActiveMQ7.IBM MQ8.Solr/Luence9.Maven/Ant10.Web Service(SOAP/REST)11.Spring12.job

2012-10-11 16:22:11 631

转载 很好的lucene3.6入门指南

Lucene3.6 入门指南Lucene系列介绍Lucene3.6 入门指南一、 简介 Lucene是什么:Lucene是apache软件基金会jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软

2012-10-11 14:41:45 831

转载 lucene中Field类详解

org.apache.lucene.demo.IndexFiles类中,使用递归的方式去索引文件。在构造了一个IndexWriter索引器之后,就可以向索引器中添加Doucument了,执行真正地建立索引的过程。遍历每个目录,因为每个目录中可能还存在目录,进行深度遍历,采用递归技术找到处于叶节点处的文件(普通的具有扩展名的文件,比如my.txt文件),然后调用如下代码中红色部分:static

2012-10-11 14:21:29 868

转载 lucene 集中analyser的比较

中文分词可以查看:http://www.open-open.com/74.htm1、StopAnalyzerStopAnalyzer能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。2、StandardAnalyzerStandardAnalyzer根据空格和符号来完成分词,还可以完成数字、字母、E-mail地址、IP地址以及中文字符的分析处理,还可以支持过滤词表,用来代替

2012-10-11 14:18:43 824

转载 Lucene高亮显示内容

public String highlight(Query query,String filedname,String text){         try {             QueryScorer queryScorer=new QueryScorer(query);             Fragmenter fragmenter=new SimpleSpanFragm

2012-10-10 16:32:18 652

转载 Solr高亮的配置参数说明

高亮的配置参数详细说明:hl.fl: 用空格或逗号隔开的字段列表。要启用某个字段的highlight功能,就得保证该字段在schema中是stored。如果该参数未被给出,那么就会高亮默认字段 standard handler会用df参数,dismax字段用qf参数。你可以使用星号去方便的高亮所有字段。如果你使用了通配符,那么要考虑启用hl.requiredFieldMatch选项。h

2012-10-10 16:30:16 563

转载 Solr设置高亮

@Test     public void test5(){         try {             SolrQuery query=new SolrQuery("程序");             query.setHighlight(true)                 .setHighlightSimplePre("")//设置开头

2012-10-10 16:29:14 745

转载 Solr执行查询操作

方法一:@Test     public void test3(){         try {             SolrQuery query=new SolrQuery("*");             QueryResponse response=httpSolrServer.query(query);             SolrDocumentLis

2012-10-10 16:28:31 612

转载 Solr添加文档到索引

solr添加文档非常方便,不用像Lucene那样一个一个添加Field,省去了很多的麻烦下面看操作方法一:private static String URI = "http://localhost:8080/solr/";      private CommonsHttpSolrServer httpSolrServer = null;      @Before

2012-10-10 16:27:06 861

转载 Solr与tomcat整合,并添加中文分词器

Solr与tomcat整合,并添加中文分词器1.将solr中的example中的solr拷贝到要作为服务器的位置(我当前创建的目录为D:\Develop\solr\home)2.将相应的solr的web程序也拷贝出来放在相应的目录(我当前创建的目录为D:\Develop\solr\web)3.修改solr-->home文件夹中的solrconfig.xml设置data的路径4.

2012-10-10 16:24:44 425

转载 Lucene自定义评分查询

package com.lucene.score;  import java.io.IOException; import java.sql.Date; import java.text.SimpleDateFormat;  import org.apache.lucene.document.Document; import org.apache.lucene.inde

2012-10-10 16:18:07 539

转载 lucene评分分析2

在IndexSearcher类中有一个管理Lucene得分情况的方法,如下所示:public Explanation explain(Weight weight, int doc) throws IOException {    return weight.explain(reader, doc);}返回的这个Explanation的实例解释了Lucene中Document的得分情

2012-10-10 16:15:35 503

转载 小编辑 Lucene 的 Scoring 评分机制

Lucene 评分体系/机制(lucene scoring)是 Lucene 出名的一核心部分。它对用户来说隐藏了很多复杂的细节,致使用户可以简单地使用 lucene。但个人觉得:如果要根据自己的应用调节评分(或结构排序),十分有必须深入了解 lucene 的评分机制。Lucene scoring 组合使用了 信 息检索的向量空间模型 和 布尔模型 。首先来看下 lucene 的评

2012-10-10 16:13:44 342

转载 luence入门pojo

第一阶段:1.建立普通POJO类package org.yinpeng.test.lucence;public class User { private int id; private String firstName; private String lastName;  public User(){   }  public User(int id,

2012-10-10 15:55:16 544

转载 简单的luence例子

Lucene的使用,简单来说可以划分为两种类型,一是建立索引,二是搜索内容。一、建立索引的五个基础类 Document, Field, IndexWriter, Analyzer, Directory1、Document类:用来描述文档,这里的文档可以指一个HTML页面,一封电子邮件,或者是一个文本文件。一个 Document 对象由多个Field对象组成的。可以把一个Docume

2012-10-10 15:46:54 340

转载 Lucene 文本搜索

import java.io.File;import java.io.IOException;import java.util.Date;import org.apache.lucene.document.Document;import org.apache.lucene.index.Term;import org.apache.lucene.search.IndexSea

2012-10-10 15:40:04 317

转载 Lucene 索引创建

import java.io.File;  import java.util.ArrayList;    import org.apache.lucene.analysis.Analyzer;  import org.apache.lucene.document.Document;  import org.apache.lucene.document.Field;  import org.apac

2012-10-10 15:38:45 314

转载 Lucene入门教程03

Lucene教程1 lucene简介1.1 什么是lucene    Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。2 lucene的工作方式    lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是

2012-10-10 15:33:50 410

转载 Lucene入门

Lucene入门Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的

2012-10-10 14:00:07 270

转载 luence教程0

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单。Lucene2.0,它与以前广泛应用和介绍的Lucene 1.

2012-10-10 11:38:44 409

转载 luence入门

、利用Lucene构建搜索引擎的一般过程:   各类文档的字符化——>对字符数据进行分词——>建立索引——>搜索(选择搜索字段、搜索方式,执行搜索)。2、Lucene文件系统说明:   %LUCENE_HOME%\contrib\:Lucene扩展包,包括针对多种语言的分词工具、亮亮显示、Ant、xml文件解析等。其他目录无需赘言,清晰明了。3、Lucene主要包结构:   |

2012-10-10 11:36:22 506

转载 从概念理解Lucene的Index(索引)文档模型

Lucene主要有两种文档模型:Document和Field,一个Document可能包含若干个Field。每一个Field有不同的策略:1.被索引 or not,将该字段(Field)经过分析(Analyisi)后,加入索引中,并不是原文 。2.如果被索引,可选择是否保存“term vector”(向量),用于相似检索。3.可选择是否存储(store),将原文直接拷贝 ,不做索引

2012-10-10 11:35:19 572

转载 影响Lucene对文档打分的四种方式

在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。如果不进行设定,则Document

2012-10-10 11:34:18 1007

原创 luence初级教程1

所需jar包:lucene-core-3.6.1.jar,lucene-test-framework-3.6.1.jar,ant-junit-1.7.1.jar,ant-1.7.1.jar,ant-launcher-1.7.1.jar,junit-4.10.jar,hamcrest-core-1.1.jar########################################

2012-10-10 09:35:54 530

转载 Lucene 教程2

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单。Lucene2.0,它与以前广泛应用和介绍的Lucene 1.

2012-10-09 13:28:58 335

转载 10个面向对象设计原则

面向对象设计原则是OOPS(Object-Oriented Programming System,面向对象的程序设计系统)编程的核心,但大多数Java程序员追逐像Singleton、Decorator、Observer这样的设计模式,而不重视面向对象的分析和设计。甚至还有经验丰富的Java程序员没有听说过OOPS和SOLID设计原则,他们根本不知道设计原则的好处,也不知道如何依照这些原则来进行编程

2012-10-09 12:56:45 365

转载 面向对象设计原则理解

面向对象设计(OOD)核心原则让我的程序模块达到“高内聚低耦合”,这是来自于30年前兴起的结构化设计(structured Design),但是同样适用于我们的OOD。1.高内聚:    高内聚是指某个特定模块(程序,类型)都应完成一系列相关功能,描述了不同程序,类型中方法,方法中不同操作描述的逻辑之间的距离相近。高内聚意味可维护性,可重新性,因为模块对外部的依赖少(功能的完备性)。如果两

2012-10-09 12:54:28 419

转载 面向对象设计原则汇总

OO本身就是一种大的设计模式,它是随着软件规模越来越大产生出来帮助人们建模和开发的理念,生来就带着封装、继承、多态等可复用基因。为了充分发挥这些基因的功效,使用者需要遵守一定的原则,就是所谓的面向对象设计原则。然而正确地使用这些运用这些原则并不容易,只有把这些原则吸收成为身体一部分的经验丰富的工程师才能在遇到各种问题时,灵活地使用它们。一些OO大师为了方便新手更好地理解OO原则,就根据经验假象了一

2012-10-09 12:52:22 461

转载 明星程序员的10种特质

如今,每家公司都似乎成了科技公司。从软件创业公司到投机性投资公司、制药巨头和媒体巨头,它们都越来越多地加入到软件业务行列。  代码质量不仅成为了一个必需品,更成为了一个竞争优势。因为众多公司围绕软件而竞争,开发软件的人——软件工程师正显得越发重要。但是,你该如何发现那种百里挑一的程序员呢?在本文中,我们简明扼要地列出了明星开发人员的10种特质。  1. 热爱编程  编程是一种为了满

2012-10-09 12:45:14 693

转载 自己封装的调用HttpClient的HttpServiceCaller类

package xxx.com.util;import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import java.util.HashMap;import java.util.Map;import org.apache.commons.htt

2012-10-08 16:25:33 1952

转载 云知识

阅读本文前,最好能先了解以下的知识:了解 OpenStack 将有助于对本文的理解。本文讲解的是 Linux 虚拟网络中的一般原理方法 , 虽不仅限于应用在 OpenStack 之中 , 但本文的实验是以 OpenStack 为基础的。OpenStack 是一个开源的 IaaS 云 , 您可以从 devstack 脚本 (http://devstack.org/) 开始熟悉它。了解 Q

2012-10-08 16:16:34 1481

转载 为什么需要使用MQ?

为什么会需要消息队列(MQ)?##########################################################################################主要原因是由于在高并发环境下,由于来不及同步处理,请求往往会发生堵塞,比如说,大量的insert,update之类的请求同时到达mysql,直接导致无数的行锁表锁,甚至最后请求会

2012-10-08 15:49:25 2717

OSGI入门资料(非常beautiful的ppt)

很基础全面的OSGI ppt教程,讲解的很详细。

2013-04-19

http协议理解

  浏览器上网浏览网页,其原理也同属于上部分所描述的网络应用程序,浏览器就是客户端程序,网站服务器就是服务器程序,其占用80端口。当客户端程序访问网站时,在原理上就是访问服务器的80端口,浏览器和服务器交换数据的协议为HTTP协议,其原理就是发送请求、接收数据,而且数据都是文本形式传送的。

2012-11-28

JSON-lib开发所用jar包集合

用java开发json的应用必须用到的jar包,比较全面。

2012-11-22

基于注解方式的spring_mvc_jdbcTemplate

学习spring MVC的入门级代码。只要修改一下相应的数据源代码即可。

2012-11-07

公司的数据库规范

由于公司是互联网公司,对数据的快速响应很重视,因此新人都会培训数据库规范内容。

2012-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除