自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 自己动手写网络爬虫

讲解网络爬虫开发的,介绍如何应用云计算架构开发分布式爬虫。猎兔搜索工程师多年项目经验总结 深入介绍Web数据挖掘实现过程 光盘中提供了高效的代码解决方案 案例均使用流行的Java语言编写 目目录 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 4 1.1.1 深入理解URL 4 1.1.2 通过指定的URL抓取网页内容 6 1.1.3

2013-04-18 09:59:58 885

转载 JAVA之URL

一、用JAVA实现URL    在JAVA中,Java.net包里面的类是进行网络编程的,其中java.net.URL类和java.net.URLConection类使编程者方便地利用URL在Internet上进行网络通信。 1、创建URL对象   URL类有多种形式的构造函数: (1) URL ( String url)   //url代表一个绝对地址,URL对象直接指向这

2013-04-17 21:19:53 470

原创 在 eclipse 下的heritrix1.14.4的配置

在其他帖子上看到有Eclipse 配置 Heritrix 1.14.4的文章,对其进行真理  Eclipse 配置 Heritrix 1.14.4的配置过程如下:  1. 首先从http://sourceforge.net/projects/archive-crawler/ 中下载   heritrix-1.14.4-src.zip(Windows)  2. 在Eclips

2013-04-07 20:33:24 643 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除