自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (36)
  • 收藏
  • 关注

原创 用WebCollector制作一个爬取《知乎》并进行问题精准抽取的爬虫(JAVA)

WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。教程介绍了如何用WebCollector打造一个爬取《知乎》并进行问题精准抽取的爬虫(JAVA)

2014-07-26 18:12:52 15676 7

用WebCollector制作一个爬取《知乎》并进行问题精准抽取的爬虫(JAVA)

简介:WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。如何将WebCollector导入项目请看下面这个教程:JAVA网络爬虫WebCollector深度解析——爬虫内核参数:WebCollector无需繁琐配置,只要在代码中给出下面几个必要参数,即可启动爬虫:1.种子(必...

2014-07-26 18:12:00 330

原创 JAVA网络爬虫WebCollector深度解析——爬虫内核

JAVA开源爬虫内核WebCollector,让爬虫开发变得简单。WebCollector提供了一个稳定高效的JAVA爬虫框架,同时也提供了爬虫所需的基本类库,内置了几套基本的爬虫(有界面)。无论你是做网页爬取还是网页抽取,都可以通过几行简单的代码完成。爬虫内核有独有的“消息机制”和“URL遍历器”,可完成深网爬取。项目在github上持续更新。

2014-07-21 10:43:57 30329 6

JAVA网络爬虫WebCollector深度解析——爬虫内核

WebCollector爬虫官网:https://github.com/CrawlScript/WebCollector技术讨论群:250108697如何将爬虫内核导入自己的项目?1.进入爬虫官网http://crawlscript.github.io/WebCollector/,下载压缩包,解压。2.解压后找到“webcollector-版本号-bin.zip”,解压。3...

2014-07-21 10:43:00 491

原创 JAVA开源爬虫,WebCollector,简单易用,有界面。

如果你想用爬虫下载整站内容,

2014-07-19 23:13:43 7635 5

JAVA开源爬虫,WebCollector,简单易用,有界面。

如果你想用爬虫下载整站内容,又不想配置heritrix之类的复杂爬虫,可以选择WebCollector。项目在github上持续更新。github源码地址:https://github.com/CrawlScript/WebCollectorgithub下载地址:http://crawlscript.github.io/WebCollector/运行方式:1.解压从http://c...

2014-07-19 23:13:00 226

android 背单词锁屏

android版背单词锁屏,简单的功能,可以提升您的英语水平。

2013-10-20

JAVA制作火狐内核浏览器源代码

JAVA制作火狐内核浏览器源代码,很容易运行。具体使用方法请看我的博客。

2013-10-13

org.eclipse.swt 相关jar包

org.eclipse.swt 相关jar包,JAVA调用火狐内核制作浏览器教程中所需,供各位下载,可在我的博客中查看详细用法。

2013-10-13

MozillaInterfaces.jar(火狐内核相关jar包)

java开发火狐内核所需要的jar包,由于官方获取方法比较复杂,所以这里提取出来上传到CSDN方便各位下载。详细使用方法请看我的博客。

2013-10-13

java笔试题 android版 1.1

java笔试题1.1,可在公交车上复习笔试题,流量消耗小

2013-10-11

android版java笔试题 1.0

android版java笔试题1.0,让您在公交车上可以方便地复习java笔试。

2013-10-11

java获取文本关键词的API

通过这个jar包,可以轻松获取一篇文章的API,5秒即可学会使用。可在我的CSDN博客中查看使用方法。

2013-10-06

http服务器源码--java版(适合学习)

java写的http服务器源码,有注释,适合初学者学习。可以直接使用。

2013-10-05

电脑手机中转站

怎样将电脑上正在看的网页轻松转移到手机上?使用“电脑手机中转站”这个应用,可以轻松实现。

2013-09-21

android 记事本

这是一个android的记事本,可以添加文字和图片,也可以添加闹钟,是学习的好东西。

2013-08-10

编译原理 龙书

编译原理最经典的教材,龙书,碾压任何编译原理教材。

2013-07-11

C# 照相机 好用

C# 摄像头。如果WIN7没有自带摄像头可以用这个代替

2012-12-26

C# 编写的魔兽挂,开源

C# 的魔兽挂,开源的哦,功能很齐全.很好。

2012-12-09

C# DOTA 卡尔 智能改键

C#编写的卡尔智能改键挂,可以快速切技能,提供了源代码

2012-12-09

C#美工初学,窗口渐变

一个C#的窗口渐变代码,给初学者使用,运行后会显示教程

2012-08-16

一个非常有趣的显示文字程序

一个C#写的小程序.新方法显示文字 可能算法会慢一些。由于接触内存。可能360会报错

2012-05-07

C#小程序 很好玩的

C#的小程序 很好玩的 仅供学习研究使用

2011-04-03

selenium及依赖jar包(java)

selenium及所有依赖jar包(java),selenium,java,模拟浏览器,模拟登录

2015-07-21

bbs项目源码(java+mysql)

java结合mysql的bbs论坛源码,可直接放在tomcat下使用,学习和工作的必备,包含数据库和源码两部分,内附说明和使用方法

2015-05-05

企业应用架构模式中文版 PDF.pdf.zip

本书讲述各种分析模式(即来自概念性业务模型的模式)和支持模式(即讲述如何使用分析模式的辅助性模式),把论述重点放在介绍面向对象分析和设计的最终结果—即模型本身。作者透过平实朴素的语言,将自己丰富的对象建模经验与读者分享,使读者可以马上采纳这些经验性模式。

2015-02-23

Linux系统常用命令快速入门

Linux系统常用命令快速入门

2014-12-02

AUTONOMY技术白皮书.doc

AUTONOMY技术白皮书.

2014-05-16

Linux 下用 C 语言进行数字图像处理.pdf

Linux 下用 C 语言进行数字图像处理.pdf Linux 下用 C 语言进行数字图像处理.pdf Linux 下用 C 语言进行数字图像处理.pdf

2014-05-16

均匀直线阵方向系数

均匀直线阵方向系数.m.zip均匀直线阵方向系数.m.zip均匀直线阵方向系数.m.zip

2014-05-12

算法导论第三版总结与练习思考题答案(英文)

算法导论第三版总结与练习思考题答案(英文)

2014-05-12

公司员工电脑设置清单.doc

公司员工电脑设置清单.doc

2014-05-12

WCF+Silverlight+EntityFramework+Sqlite所做的学生信息管理系统

WCF+Silverlight+EntityFramework+Sqlite所做的学生信息管理系统

2014-05-12

汇编显示时钟.asm

汇编语言是一门重要的程序设计语言 下面列举了至少4本名叫《汇编语言》的图书和教材 并简要介绍了高校计算机相关专业在开设“汇编语言”课程方面的一些情况

2014-05-11

反编译工具 C# VB DELPHI C++ C zip

计算机软件反向工程(Reverse engineering)也称为计算机软件还原工程,是指通过对他人软件的目标程序(可执行程序)进行“逆向分析、研究”工作

2014-05-11

pso工具箱 matlab

微粒群算法是一种模拟动物群体社会行为的群智能优化算法,现已成为自然计算的一个重要分支。《微粒群优化算法》分为9章,第1、第2章介绍了微粒群算法的概念、基本方程以及相关社会行为分析等,并给出了一个较为详细的综述。第3~5章从生物学背景出发,分别从个体的觅食时间、觅食行为、觅食决策等方面探讨了微粒群算法的改进模式。第6~8章的研究内容则从控制角度出发探讨微粒群算法的相关控制方式。在现实世界中,由于目标函数计算困难或计算时间较长等因素,许多复杂的优化问题难以利用微粒群算法进行优化。

2014-05-10

MSDN中文版下载

VC++的文档MSDN,C++编程必备,这是难得的中文版。

2014-05-09

毕业设计源码 搜索引擎

一个毕业设计的源码,内容是一个搜索引擎。如果有任何问题请看压缩包中附带的“使用前必读”和“教程地址“文件,教程在CSDN中有连载,百度搜索即可获取。

2014-01-21

CrawlScript-bin-beta0.3 JAVA的爬虫脚本语言

CrawlScript-bin-beta0.3 ,CrawlScript语言0.3beta版,无需配置。 JAVA的爬虫脚本语言,用几行代码即可实现对整个网站的爬取,直接执行demo中的代码,可以获取整个新华网的所有的新闻(从网页中提取出的干净的新闻)。

2014-01-20

CrawlScript-bin-beta0.1 JAVA的爬虫脚本语言

官方网站和资料: http://crawlscript.github.io/ 网络爬虫脚本语言 CrawlScript: 网络爬虫即自动获取网页信息的一种程序,有很多JAVA、C++的网络爬虫类库,但是在这些类库的基础上开发十分繁琐,需要大量的代码才可以完成一个简单的操作。鉴于这个问题,我们开发了CrawlScript这种脚本语言,程序员只需要写2-3行简单的代码,就可以制作一个强大的网络爬虫。同时,CrawlScript由JAVA编写,可以在其他JAVA程序中被简单调用。

2014-01-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除