自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (4)
  • 收藏
  • 关注

原创 robots协议标准

    前两天刚知道用爬虫抓取page有个协议的问题,尤其是对于opensource的爬虫,刚看到一篇blog,写的就是如此,难怪之前看google的robots也和另外一个U.S.的网站相同,感情是大家都商量好了,可能这方面中国的一些站点这种意识要稍微淡一点。。。同时这也害得毕设还得另谋思路。。。   搜索引擎三巨头打的不亦乐乎,但偶尔也合作一下。去年Google,雅虎,微软就合作,

2008-07-29 14:51:00 1367

原创 Oracle 10g Express Edition安装删除心得。。。

    由于要使用ODM,最好还是装个oracle,但可能由于本科时使用过oracle9i的缘故,搞的现在还是好担心它的运行情况,所以下了个Oracle 10g的ExpressEdition,只有200多MB,比标准版小得多,但目前还不知道它对ODM工具的支持情况。。。   第一次装Oracle 10g ExpressEdition的时候,由于可能是有tomcat和Heritrix

2008-07-29 14:41:00 5749 1

原创 提问:Heritrix应用问题

Heritrix应用问题请教一下大家如何用heritrix抓取以下网站内容,需要定制么?下面是USPTO的专利网页:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=0&f=S&l=50&d=PTXT&OS=+%28battery+OR+m

2008-07-10 08:39:00 1135

Essential C++中文版

Essential C++中文版,不错的C++学习资料

2010-04-29

21天学通C++的PDF版本

21天学通C++的PDF版本,由浅入深的教程

2010-04-29

Weblogic安装配置(适合新手)

Weblogic安装配置(适合新手)-适合初学Weblogic

2009-09-10

jdk6学习笔记-不错的入门资料

“著名的”jdk6学习笔记-不错的入门资料,pdf格式的

2009-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除