自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (7)
  • 收藏
  • 关注

原创 微信公共平台开发(二):回复文本消息

采集百小度的信息对微信公共号中的文本类型的消息做简单的回复,实现简单微信机器人

2015-04-14 17:16:58 3865

原创 微信公共平台开发(一):服务器配置

文档介绍了如何开启自己的微信开发之旅,如何利用java实现微信公共平台服务器有效性的验证

2015-04-14 16:18:43 13949 3

原创 文本聚类算法介绍

本博客通过对当前比较成熟的聚类算法分析,介绍如何对非结构的数据(文档)做聚类算法;如何利用搜索引擎的相关知识来解决文本聚类问题等

2015-04-10 12:58:14 22850 13

原创 基于lucene的案例开发:纵横小说阅读页采集

本文介绍了如何通过CrawlBase来实现纵横小说阅读页信息的采集,加上之前的三篇博客就完成了对纵横小说的信息采集,之后会给出具体的main方法,来实现整个流程的运行~

2015-04-08 10:40:58 2947

原创 基于lucene的案例开发:纵横小说章节列表采集

本文介绍了如何通过CrawlBase来实现纵横小说章节列表页信息的采集,同时提供了对于无法右键查看网页源代码网页的信息采集方案

2015-04-03 14:38:49 2881

原创 基于lucene的案例开发:纵横小说简介页采集

本文通过对纵横小说简介页源代码的分析,介绍了如何通过CrawlBase来采集相关信息

2015-04-03 10:45:20 3244 1

原创 基于lucene的案例开发:纵横小说更新列表页抓取

本文以纵横中文小说网的更新列表页为例,详细的介绍了如何通过HttpClient去采集更新列表页的内容,介绍如何使用自建类CrawlListPageBase以及如何处理非预期BUG

2015-04-02 14:38:55 3394

提取PDF文件中的文本内容

该工具实现了提取PDF文件的内容至TXT文件中。 无论PDF文件是否加密,都可实现。 该软件需要安装jdk1.7(含)以上版本 详细使用方法参照博客:http://blog.csdn.net/xiaojimanman/article/details/43527755

2015-02-05

英文 算法导论

英文版算法导论,免费下载,没有任何积分~

2014-04-04

基于lucene创建实时索引基础jar包源码

1) 提供实时索引的创建、管理 2) Query的创建 详细介绍参照博客:http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

基于lucene创建实时索引基础jar包

1) 提供实时索引的创建、管理 2) Query的创建 详细功能参照博客:http://blog.csdn.net/xiaojimanman/article/details/20624739 中的介绍

2014-03-06

网页自动采集java程序实现

该资源以内涵吧内涵段子和笑话集为例实现了网页的自动抓取、存储等

2014-02-13

笑话集网站最近更新网站内容采集java实现

笑话集网站最近更新网站内容采集java实现

2014-02-13

表情自动生成器java代码实现

实现了臣妾真的做不到啊、妈妈再打我一次、王宝强泰囧三张图片,如想处理其他图片,在类 cn.lulei.util.img.ImgParams 、前台index.html 和 index.js 两个文件做相应的配置即可实现

2014-01-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除