2015年04月_xiaojimanman

12月 11月 10月 09月 08月 07月 05月 04月 03月 02月 01月

原创微信公共平台开发（二）：回复文本消息

采集百小度的信息对微信公共号中的文本类型的消息做简单的回复，实现简单微信机器人

2015-04-14 17:16:58 3865

原创微信公共平台开发（一）：服务器配置

文档介绍了如何开启自己的微信开发之旅，如何利用java实现微信公共平台服务器有效性的验证

2015-04-14 16:18:43 13949 3

原创文本聚类算法介绍

本博客通过对当前比较成熟的聚类算法分析，介绍如何对非结构的数据（文档）做聚类算法；如何利用搜索引擎的相关知识来解决文本聚类问题等

2015-04-10 12:58:14 22850 13

原创基于lucene的案例开发：纵横小说阅读页采集

本文介绍了如何通过CrawlBase来实现纵横小说阅读页信息的采集，加上之前的三篇博客就完成了对纵横小说的信息采集，之后会给出具体的main方法，来实现整个流程的运行~

2015-04-08 10:40:58 2947

原创基于lucene的案例开发：纵横小说章节列表采集

本文介绍了如何通过CrawlBase来实现纵横小说章节列表页信息的采集，同时提供了对于无法右键查看网页源代码网页的信息采集方案

2015-04-03 14:38:49 2881

原创基于lucene的案例开发：纵横小说简介页采集

本文通过对纵横小说简介页源代码的分析，介绍了如何通过CrawlBase来采集相关信息

2015-04-03 10:45:20 3244 1

原创基于lucene的案例开发：纵横小说更新列表页抓取

本文以纵横中文小说网的更新列表页为例，详细的介绍了如何通过HttpClient去采集更新列表页的内容，介绍如何使用自建类CrawlListPageBase以及如何处理非预期BUG

2015-04-02 14:38:55 3394

提取PDF文件中的文本内容

该工具实现了提取PDF文件的内容至TXT文件中。无论PDF文件是否加密，都可实现。该软件需要安装jdk1.7（含）以上版本详细使用方法参照博客：http://blog.csdn.net/xiaojimanman/article/details/43527755

2015-02-05

英文算法导论

英文版算法导论，免费下载，没有任何积分~

2014-04-04

基于lucene创建实时索引基础jar包源码

1) 提供实时索引的创建、管理 2) Query的创建详细介绍参照博客：http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

基于lucene创建实时索引基础jar包

1) 提供实时索引的创建、管理 2) Query的创建详细功能参照博客：http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

网页自动采集java程序实现

该资源以内涵吧内涵段子和笑话集为例实现了网页的自动抓取、存储等

2014-02-13

笑话集网站最近更新网站内容采集java实现

2014-02-13

表情自动生成器java代码实现

实现了臣妾真的做不到啊、妈妈再打我一次、王宝强泰囧三张图片，如想处理其他图片，在类 cn.lulei.util.img.ImgParams 、前台index.html 和 index.js 两个文件做相应的配置即可实现

2014-01-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人