自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(99)
  • 资源 (7)
  • 收藏
  • 关注

原创 关于HttpClient模拟浏览器请求的参数乱码问题解决方案

利用HttpClient模拟浏览器行为获取网页内容时,当参数中有中文,在服务器端解析出的参数值中的中文都是“?”,这里就给你完美的解决方案

2015-03-18 11:04:15 7177 1

原创 程序员实习过程中应该掌握的问问题技巧

在工作过程中,我们会遇到各种各样的问题,面对这些问题,我们该如何解决?又该如何向别人提问?这里给你答案

2015-03-17 17:42:20 4379

原创 基于lucene的案例开发:实时索引的修改

实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来操作,这里就对实时索引中的增删改操作进行进一步的封装,实现实时索引的基本操作

2015-03-15 20:52:42 3864

原创 基于lucene的案例开发:实时索引的检索

我们之前已经介绍了IndexSearcher中的检索方法,也介绍了如何基于lucene中的NRT*类去创建实时索引,这里我们就重点介绍下基于实时索引的检索方案,实现NRTSearch基类

2015-03-15 20:14:06 3393

原创 百鸡百钱问题解答

鸡翁一值钱五,鸡母一值钱三,鸡雏三值钱一。百钱买百鸡,问鸡翁、鸡母、鸡雏各几何?

2015-03-05 17:09:24 5127

原创 基于lucene的案例开发:实时索引管理类IndexManager

基于lucene中的NRT*类实现实时索引:将IndexWrite的相关操作委托给TrackingIndexWriter来处理;开启内存索引重读线程和内存数据commit线程;获取最新可用的IndexSearcher;另类的单例模式实现加载多个索引

2015-03-02 11:12:13 3795 4

原创 基于lucene的案例开发:实现实时索引基本原理

介绍Lucene实现实时索引的基本原理,通过几幅简单的图片,介绍了实时索引实现的过程;同时还给出了该系列中的索引的配置类实现

2015-02-28 11:04:14 5190

原创 过年回来博客开始更新

首先要和大家说一声抱歉,过年这段时间回家博客就断了更新,明天起,博客开始正常更新,一星期2篇以上(直到 基于lucene的案例开发 这个系列结束)。还有一个信息就是个人的工作小屋已经上线了,网址 www.llwjy.com 个人的所有博客也会在该网站上显示,博客地址 http://www.llwjy.com/blog.php ,欢迎大家来吐槽

2015-02-27 22:06:17 2588

原创 个人源码检索网站已经开始开发

个人域名备案成功啦!欢迎各位访问~

2015-02-12 20:57:03 3157 4

原创 提取PDF文件中的文本信息

该工具实现了PDF文件的文本信息提取,无论PDF文件是否加密,都可提取其内容

2015-02-05 15:00:41 5347 6

原创 基于lucene的案例开发:数据库连接池

通过java程序去连接数据库时,使用的协议是TCP/IP协议,TCP/IP协议需要进行3次握手。如果每一次数据库操作都需要创建一个新的连接,都要进行3次握手,这是十分浪费资源的,程序的效率也不是很高,数据库连接池就很好的解决了这个问题

2015-01-29 16:43:33 3036

原创 基于lucene的案例开发:ParseUtil & ParseRequest

介绍将字符串转化为数值的工具类ParseUtil 和 获取request参数值类ParseRequest,这两个类在做后台项目中还是比较有用的。

2015-01-27 22:34:47 2645

原创 基于lucene的案例开发:ClassUtil & CharsetUtil

介绍ClassUtil类和CharsetUtil类,这两个也是项目中比较常用的类,一个用于指定文件路径,一个用于检测文件的编码方式。

2015-01-27 21:19:58 2866

原创 基于lucene的案例开发:JsonUtil & XmlUtil

json数据格式和xml格式数据的处理方法,以及将javabean转化为json数据或xml数据

2015-01-27 14:02:53 3853 4

原创 基于lucene的案例开发:案例初识

博客对案例的整体简单的介绍,明白整个案例的目的是什么?最终的产品大概是什么样子?以及每个部分是基于什么技术做的开发。

2015-01-27 10:56:27 4092

原创 基于lucene的案例开发:更新说明

转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/43154813      这系列博客从小说的采集、搜索、展示等多方面的介绍基于lucene站内搜索的开发过程,前面已介绍完毕第一部分,由于白天需要工作,一些博客内容需要晚上或者上班奸细进行整理,所以更新速度上难免会有点慢。      到现在为止,利用上周末的时间,原型和数据

2015-01-26 17:16:38 2412

原创 基于lucene的案例开发:IndexSearcher中检索方法

lucene最主要的功能在于其搜索,在搜索过程中可能会使用到Query、Filter、Sort、ScoreDoc、Collector等,本文从这些角度介绍了一些常用的搜索方法,同时还介绍了索引的增删改接口。

2015-01-23 11:16:22 7796

原创 基于lucene的案例开发:Query查询

在Lucene索引的搜索过程中,构建Query对象是一个十分重要的过程,在这篇博客中,我们将重点介绍几种常用的Query子类:QueryParser、MultiFieldQueryParser、TermQuery、PrefixQuery、PhraseQuery、WildcardQuery、TermRangeQuery、NumericRangeQuery、BooleanQuery

2015-01-21 16:03:19 4605 2

原创 基于lucene的案例开发:分词器介绍

在lucene创建索引的过程中,分词技术是一个十分重要的环节,介绍了7中比较常见的分词技术 CJKAnalyzer、KeywordAnalyzer、SimpleAnalyzer、StopAnalyzer、WhitespaceAnalyzer、StandardAnalyzer、IKAnalyzer

2015-01-20 14:19:39 7764 6

原创 基于lucene的案例开发:搜索索引

通过简单的事例介绍了如何去搜索Lucene索引,同时还介绍了索引搜索过程中的几个核心类:Directory、DirectoryReader、IndexSearcher、Analyzer、Query、TopDocs

2015-01-19 22:06:13 3083 2

原创 基于lucene的案例开发:创建索引

通过简单的事例,介绍了如何创建Lucene索引,同时还介绍了在索引创建过程中的几个核心类:IndexWriter、Directory、Analyzer、Document、Field。

2015-01-19 14:49:24 5471 5

原创 基于lucene的案例开发:索引文件结构

lucene索引文件有一定的层次结构,有索引、段、文档、域、词五个层次;索引文件不仅保存了正向信息,同时还保存了反向信息。

2015-01-18 16:19:21 2848 1

原创 基于lucene的案例开发:索引数学模型

lucene将一篇文档分成若干个域,每个域又分成若干个词元,通过词元在文档中的重要程度,将文档转化为N维的空间向量,通过计算两个向量之间的夹角余弦值来计算两个文档的相似程度

2015-01-18 00:13:15 2812 5

原创 基于lucene的案例开发:lucene初始认知

通过简单的事例介绍了数据的分类以及如何对非结构化数据进行检索

2015-01-17 13:23:22 2671 4

原创 基于lucene的案例开发:写在开始之前

从小说采集、索引、展示系统的介绍如何基于lucene开发一个站内搜索系统。自己在系统总结的同时,也希望各位看客能从中学习到一些东西,大家共同进步。

2015-01-17 12:07:16 1987 5

原创 使用hadoop实现平均数~并输出top N

本文通过具体的实例,介绍如何使用hadoop中mapreduce程序解决平均数以及top N的相关问题。

2014-11-14 13:59:40 4621

原创 基于HttpClient实现网络爬虫~以百度新闻为例

以百度新闻为例,介绍如何基于HttpClient去采集网络新闻资源信息。

2014-11-07 13:48:55 13976 17

原创 使用hadoop实现ip地理位置统计~ip归属地和运营商

使用hadoop实现IP归属地的统计,为分析用户的地区分布提供数据

2014-10-29 15:00:00 2874 4

原创 使用hadoop实现IP个数统计~并将结果写入数据库

通过hadoop中的MapReduce实现Apache日志中的IP个数统计,并将计算结果输出到mysql数据库中。

2014-10-22 11:32:51 4463 3

原创 使用hadoop实现关联商品统计

根据超市的销售清单,采用hadoop中的mapreduce计算商品之间的关联程度(即统计同时买A商品和B商品的次数)

2014-10-17 14:03:23 2753

原创 java实现字符串匹配问题之求两个字符串的最大公共子串

本文通过简单的事例阐述字符串对比的算法思想,并用java给予实现。该算法可以用于求两个字符串的子串、最大子串等。

2014-08-29 14:35:49 8228 1

原创 用java实现简单的搜索引擎

纯java实现简单的搜索引擎

2014-07-19 11:10:31 25305 1

原创 java操作excel文件基础架构实现,支持2007以上版本

转载请注明出处:java操作office文件现在主流的jar包有jxl和POI,由于目前jxl.jar没有人更新,并不支持Excel2007及其以上版本,Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。POI结构如下:HSSF - 提供读写Microsoft Excel格式档案的功能

2014-04-02 15:27:01 3133 1

原创 基于java实现mongodb的数据库连接池

转载请注明出处:MongoDB是介于关系数据库和非关系数据库之间的一种产品,文件的存储格式为BSON(一种JSON的扩展),关于MongoDB的其他介绍请参考百度百科  http://baike.baidu.com/subview/3385614/9338179.htm         关于mongodb的下载安装以及一些基本的命令操作可以参照  http://user.qzone.qq.

2014-03-31 10:55:07 8674 3

原创 java实现16进制字符串转化为long值

转载请注明出处:        本篇博客主要介绍一下如何将16进制的字符串转化为long值,具体代码实现如下: /** *@Description: */ package cn.lulei.util; public class Test { /** * @param md5L16 * @return * @Date:2014-3-18

2014-03-18 14:41:21 13774 2

原创 使用java自带加密算法实现文本的md5加密算法

转载请注明出处:       本篇使用java自带的MessageDigest实现对文本的md5加密算法,具体代码如下: /** *@Description: 将字符串转化为MD5 */ package cn.yicha.novel.util; import java.security.MessageDigest;import java.security.NoSuchAl

2014-03-18 14:13:27 16305 5

原创 基于lucene创建实时索引基础jar包

转载请注明来源:         最近的工作需要自己创建各种内部产品的索引,每次都要重复一样的工作,不断的将一个项目下的类文件拷贝到另一个项目中,然后修改一些配置,这种事情真的很浪费时间,因此自己就终结了这个jar包lucene_4.3.1_fat.jar,这个jar包基于lucene4.3.1版本做的。下面就简单介绍下关于jar包的使用:lucene_fat.jar使用说明1、依

2014-03-06 14:31:16 3670

原创 评测方法收集

人才评测方法 :http://baike.baidu.com/link?url=D6arTOnUGE3oqUUTHjMcWK_Pvuz37WdG6IojoMAgJ2TNHZ0aLiS6AVrtUR0qRH-lJl5xOWP760_OhO5i6LP2Hq信用评价方法:http://baike.baidu.com/link?url=DYhvavls6q74Fm7RARXcC5hyI0VMRkRet

2014-02-28 12:27:02 1030

原创 英雄会半质数的个数实现

详细题目网址参照: http://hero.csdn.net/Question/Details?ID=287&ExamID=282对于该问题的实现方式如下: /** *@Description: 半质数求法 */ package cn.lulei.util; import java.util.ArrayList;import java.util.HashSet;

2014-02-27 17:47:27 1405 3

原创 网页自动采集之内涵吧内涵段子自动采集

这篇博客属于博客 http://blog.csdn.net/xiaojimanman/article/details/19158815 的拓展,建议阅读此篇博客前先阅读上一篇博客。        上一篇博客介绍了关于笑话集网站的自动采集,这篇将对其进行扩展,介绍多内涵吧内涵段子的自动采集。        上一篇博客已经详细的介绍了几个基础类,现在就只取构建子类,来实现内涵吧内涵段子

2014-02-13 17:58:14 3463 2

提取PDF文件中的文本内容

该工具实现了提取PDF文件的内容至TXT文件中。 无论PDF文件是否加密,都可实现。 该软件需要安装jdk1.7(含)以上版本 详细使用方法参照博客:http://blog.csdn.net/xiaojimanman/article/details/43527755

2015-02-05

英文 算法导论

英文版算法导论,免费下载,没有任何积分~

2014-04-04

基于lucene创建实时索引基础jar包源码

1) 提供实时索引的创建、管理 2) Query的创建 详细介绍参照博客:http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

基于lucene创建实时索引基础jar包

1) 提供实时索引的创建、管理 2) Query的创建 详细功能参照博客:http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

网页自动采集java程序实现

该资源以内涵吧内涵段子和笑话集为例实现了网页的自动抓取、存储等

2014-02-13

笑话集网站最近更新网站内容采集java实现

笑话集网站最近更新网站内容采集java实现

2014-02-13

表情自动生成器java代码实现

实现了臣妾真的做不到啊、妈妈再打我一次、王宝强泰囧三张图片,如想处理其他图片,在类 cn.lulei.util.img.ImgParams 、前台index.html 和 index.js 两个文件做相应的配置即可实现

2014-01-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除