- 博客(99)
- 资源 (7)
- 收藏
- 关注
原创 关于HttpClient模拟浏览器请求的参数乱码问题解决方案
利用HttpClient模拟浏览器行为获取网页内容时,当参数中有中文,在服务器端解析出的参数值中的中文都是“?”,这里就给你完美的解决方案
2015-03-18 11:04:15 7177 1
原创 基于lucene的案例开发:实时索引的修改
实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来操作,这里就对实时索引中的增删改操作进行进一步的封装,实现实时索引的基本操作
2015-03-15 20:52:42 3864
原创 基于lucene的案例开发:实时索引的检索
我们之前已经介绍了IndexSearcher中的检索方法,也介绍了如何基于lucene中的NRT*类去创建实时索引,这里我们就重点介绍下基于实时索引的检索方案,实现NRTSearch基类
2015-03-15 20:14:06 3393
原创 基于lucene的案例开发:实时索引管理类IndexManager
基于lucene中的NRT*类实现实时索引:将IndexWrite的相关操作委托给TrackingIndexWriter来处理;开启内存索引重读线程和内存数据commit线程;获取最新可用的IndexSearcher;另类的单例模式实现加载多个索引
2015-03-02 11:12:13 3795 4
原创 基于lucene的案例开发:实现实时索引基本原理
介绍Lucene实现实时索引的基本原理,通过几幅简单的图片,介绍了实时索引实现的过程;同时还给出了该系列中的索引的配置类实现
2015-02-28 11:04:14 5190
原创 过年回来博客开始更新
首先要和大家说一声抱歉,过年这段时间回家博客就断了更新,明天起,博客开始正常更新,一星期2篇以上(直到 基于lucene的案例开发 这个系列结束)。还有一个信息就是个人的工作小屋已经上线了,网址 www.llwjy.com 个人的所有博客也会在该网站上显示,博客地址 http://www.llwjy.com/blog.php ,欢迎大家来吐槽
2015-02-27 22:06:17 2588
原创 基于lucene的案例开发:数据库连接池
通过java程序去连接数据库时,使用的协议是TCP/IP协议,TCP/IP协议需要进行3次握手。如果每一次数据库操作都需要创建一个新的连接,都要进行3次握手,这是十分浪费资源的,程序的效率也不是很高,数据库连接池就很好的解决了这个问题
2015-01-29 16:43:33 3036
原创 基于lucene的案例开发:ParseUtil & ParseRequest
介绍将字符串转化为数值的工具类ParseUtil 和 获取request参数值类ParseRequest,这两个类在做后台项目中还是比较有用的。
2015-01-27 22:34:47 2645
原创 基于lucene的案例开发:ClassUtil & CharsetUtil
介绍ClassUtil类和CharsetUtil类,这两个也是项目中比较常用的类,一个用于指定文件路径,一个用于检测文件的编码方式。
2015-01-27 21:19:58 2866
原创 基于lucene的案例开发:JsonUtil & XmlUtil
json数据格式和xml格式数据的处理方法,以及将javabean转化为json数据或xml数据
2015-01-27 14:02:53 3853 4
原创 基于lucene的案例开发:案例初识
博客对案例的整体简单的介绍,明白整个案例的目的是什么?最终的产品大概是什么样子?以及每个部分是基于什么技术做的开发。
2015-01-27 10:56:27 4092
原创 基于lucene的案例开发:更新说明
转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/43154813 这系列博客从小说的采集、搜索、展示等多方面的介绍基于lucene站内搜索的开发过程,前面已介绍完毕第一部分,由于白天需要工作,一些博客内容需要晚上或者上班奸细进行整理,所以更新速度上难免会有点慢。 到现在为止,利用上周末的时间,原型和数据
2015-01-26 17:16:38 2412
原创 基于lucene的案例开发:IndexSearcher中检索方法
lucene最主要的功能在于其搜索,在搜索过程中可能会使用到Query、Filter、Sort、ScoreDoc、Collector等,本文从这些角度介绍了一些常用的搜索方法,同时还介绍了索引的增删改接口。
2015-01-23 11:16:22 7796
原创 基于lucene的案例开发:Query查询
在Lucene索引的搜索过程中,构建Query对象是一个十分重要的过程,在这篇博客中,我们将重点介绍几种常用的Query子类:QueryParser、MultiFieldQueryParser、TermQuery、PrefixQuery、PhraseQuery、WildcardQuery、TermRangeQuery、NumericRangeQuery、BooleanQuery
2015-01-21 16:03:19 4605 2
原创 基于lucene的案例开发:分词器介绍
在lucene创建索引的过程中,分词技术是一个十分重要的环节,介绍了7中比较常见的分词技术 CJKAnalyzer、KeywordAnalyzer、SimpleAnalyzer、StopAnalyzer、WhitespaceAnalyzer、StandardAnalyzer、IKAnalyzer
2015-01-20 14:19:39 7764 6
原创 基于lucene的案例开发:搜索索引
通过简单的事例介绍了如何去搜索Lucene索引,同时还介绍了索引搜索过程中的几个核心类:Directory、DirectoryReader、IndexSearcher、Analyzer、Query、TopDocs
2015-01-19 22:06:13 3083 2
原创 基于lucene的案例开发:创建索引
通过简单的事例,介绍了如何创建Lucene索引,同时还介绍了在索引创建过程中的几个核心类:IndexWriter、Directory、Analyzer、Document、Field。
2015-01-19 14:49:24 5471 5
原创 基于lucene的案例开发:索引文件结构
lucene索引文件有一定的层次结构,有索引、段、文档、域、词五个层次;索引文件不仅保存了正向信息,同时还保存了反向信息。
2015-01-18 16:19:21 2848 1
原创 基于lucene的案例开发:索引数学模型
lucene将一篇文档分成若干个域,每个域又分成若干个词元,通过词元在文档中的重要程度,将文档转化为N维的空间向量,通过计算两个向量之间的夹角余弦值来计算两个文档的相似程度
2015-01-18 00:13:15 2812 5
原创 基于lucene的案例开发:写在开始之前
从小说采集、索引、展示系统的介绍如何基于lucene开发一个站内搜索系统。自己在系统总结的同时,也希望各位看客能从中学习到一些东西,大家共同进步。
2015-01-17 12:07:16 1987 5
原创 使用hadoop实现平均数~并输出top N
本文通过具体的实例,介绍如何使用hadoop中mapreduce程序解决平均数以及top N的相关问题。
2014-11-14 13:59:40 4621
原创 使用hadoop实现IP个数统计~并将结果写入数据库
通过hadoop中的MapReduce实现Apache日志中的IP个数统计,并将计算结果输出到mysql数据库中。
2014-10-22 11:32:51 4463 3
原创 使用hadoop实现关联商品统计
根据超市的销售清单,采用hadoop中的mapreduce计算商品之间的关联程度(即统计同时买A商品和B商品的次数)
2014-10-17 14:03:23 2753
原创 java实现字符串匹配问题之求两个字符串的最大公共子串
本文通过简单的事例阐述字符串对比的算法思想,并用java给予实现。该算法可以用于求两个字符串的子串、最大子串等。
2014-08-29 14:35:49 8228 1
原创 java操作excel文件基础架构实现,支持2007以上版本
转载请注明出处:java操作office文件现在主流的jar包有jxl和POI,由于目前jxl.jar没有人更新,并不支持Excel2007及其以上版本,Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。POI结构如下:HSSF - 提供读写Microsoft Excel格式档案的功能
2014-04-02 15:27:01 3133 1
原创 基于java实现mongodb的数据库连接池
转载请注明出处:MongoDB是介于关系数据库和非关系数据库之间的一种产品,文件的存储格式为BSON(一种JSON的扩展),关于MongoDB的其他介绍请参考百度百科 http://baike.baidu.com/subview/3385614/9338179.htm 关于mongodb的下载安装以及一些基本的命令操作可以参照 http://user.qzone.qq.
2014-03-31 10:55:07 8674 3
原创 java实现16进制字符串转化为long值
转载请注明出处: 本篇博客主要介绍一下如何将16进制的字符串转化为long值,具体代码实现如下: /** *@Description: */ package cn.lulei.util; public class Test { /** * @param md5L16 * @return * @Date:2014-3-18
2014-03-18 14:41:21 13774 2
原创 使用java自带加密算法实现文本的md5加密算法
转载请注明出处: 本篇使用java自带的MessageDigest实现对文本的md5加密算法,具体代码如下: /** *@Description: 将字符串转化为MD5 */ package cn.yicha.novel.util; import java.security.MessageDigest;import java.security.NoSuchAl
2014-03-18 14:13:27 16305 5
原创 基于lucene创建实时索引基础jar包
转载请注明来源: 最近的工作需要自己创建各种内部产品的索引,每次都要重复一样的工作,不断的将一个项目下的类文件拷贝到另一个项目中,然后修改一些配置,这种事情真的很浪费时间,因此自己就终结了这个jar包lucene_4.3.1_fat.jar,这个jar包基于lucene4.3.1版本做的。下面就简单介绍下关于jar包的使用:lucene_fat.jar使用说明1、依
2014-03-06 14:31:16 3670
原创 评测方法收集
人才评测方法 :http://baike.baidu.com/link?url=D6arTOnUGE3oqUUTHjMcWK_Pvuz37WdG6IojoMAgJ2TNHZ0aLiS6AVrtUR0qRH-lJl5xOWP760_OhO5i6LP2Hq信用评价方法:http://baike.baidu.com/link?url=DYhvavls6q74Fm7RARXcC5hyI0VMRkRet
2014-02-28 12:27:02 1030
原创 英雄会半质数的个数实现
详细题目网址参照: http://hero.csdn.net/Question/Details?ID=287&ExamID=282对于该问题的实现方式如下: /** *@Description: 半质数求法 */ package cn.lulei.util; import java.util.ArrayList;import java.util.HashSet;
2014-02-27 17:47:27 1405 3
原创 网页自动采集之内涵吧内涵段子自动采集
这篇博客属于博客 http://blog.csdn.net/xiaojimanman/article/details/19158815 的拓展,建议阅读此篇博客前先阅读上一篇博客。 上一篇博客介绍了关于笑话集网站的自动采集,这篇将对其进行扩展,介绍多内涵吧内涵段子的自动采集。 上一篇博客已经详细的介绍了几个基础类,现在就只取构建子类,来实现内涵吧内涵段子
2014-02-13 17:58:14 3463 2
提取PDF文件中的文本内容
2015-02-05
基于lucene创建实时索引基础jar包源码
2014-03-06
基于lucene创建实时索引基础jar包
2014-03-06
表情自动生成器java代码实现
2014-01-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人