自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (7)
  • 问答 (2)
  • 收藏
  • 关注

原创 Wget

初识Wget 今天打算自己写一个httpclient应用,看到自己半年前的代码提示自己调用httpclient都是不提倡的方法,所以写一个新的。 查看开发文档,只有在线的,源码中也没有。对 hc.apache.org查了半天,找了一个目录:http://hc.apache.org/httpcomponents-client-4.4.x/httpclient/ 开发文档都在,接下里就是下载。网上

2015-05-28 16:44:09 559

原创 java中Url处理

在开发爬虫的过程中会解析出Url地址,因为不同网站的不同风格,这些Url有些是相对路径,有些是绝对路径,有些是广告链接。 我们需要统一处理这些新的额Url1.过滤Url 假如我们想只采集一个网站的信息,就需要把和这个网站有关的Url放入queue 一般的方法是Regex 根据网站Url的特点编写,逐一匹配过滤Url。2.相对地址转绝对地址有些网站的Url采用相对地址,有些是绝对地址,绝对地址

2015-05-27 19:17:21 840

原创 Mysql 数据导入

情景:需要把A表的数据导入同一个数据库的B表中 语句:> insert into> donews(Url,title,keywords,description,content,create_time,crawler_time,site,first_img_src)> SELECT> Url,title,keywords,description,content,create_time,cra

2015-05-19 17:16:18 431

原创 简单的爬虫停止代码

今天第二段shell脚本 停止运行的Java爬虫spiderPID=0for spider in spider141212Run spider141205Run spider141213Run spider141204Rundo echo 'stop crawler' $spider $te; ps=`ps -ef | grep $spider | grep -v grep`

2015-05-08 15:40:14 1050

groovy-3.0.9.msi

groovy window 安装包

2021-12-16

spring 离线文档

spring 离线文档 用于离线查看spring接口 下载之后解压即可

2017-12-04

pro+WF4.5pdf

C# workflow 技术文档,英文原版。

2014-04-25

C语言解析WMV,ASF格式文件

C语言解析ASF格式文件,打印头对象

2013-10-27

jsp数据库连接管理

适合初学者练习jsp连接mysql数据库。简单但的数据库操作。 增加、删除、修改数据库的数据。

2012-10-09

c语言源代码

数组对角线求和,联系数组中数据的操作。适合初学者使用。

2011-12-04

c语言打印控制

c语言基础,适合 初学 者 使用。

2011-12-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除