毕业设计
alphaleng
爱好广泛
展开
-
关于Content-Type的一张表
http://www.utoronto.ca/webdocs/HTMLdocs/Book/Book-3ed/appb/mimetype.html Description of Data Content Typical Filename Extensions MIME type/sub转载 2008-03-09 13:29:00 · 535 阅读 · 0 评论 -
处理正则表达式的java包:regexp
原文:http://hedong.3322.org/archives/000309.html处理正则表达式的java包:regexp 虽然apache认为JakartaORO是一个更完备的正则表达式处理包,但regexp的应用也是非常广泛,大概是因为它的简单吧。下面是regexp的学习笔记。 1、下载安装 下载源码cvs -d :pserver:anoncvs@cvs.转载 2008-03-10 13:24:00 · 837 阅读 · 0 评论 -
一种高性能分布式Web爬行器的设计与实现(一)
原文:Design and Implementation of a High-Performance Distributed Web Crawler Vladislav Shkapenyuk Torsten SuelCIS DepartmentPolytechnic UniversityBrooklyn, NY 11201vshkap@research.翻译 2008-03-12 16:24:00 · 1396 阅读 · 0 评论 -
URL格式规范
一、格式说明 ”|” 表示隔开的两部分只能出现其中一个,方括号[]括起来的表示可选,文字由双引号”"括起来,以n*开头表示至少n个或更多的,n的缺省值为0。二、总体格式genericurl = scheme “:” schemepartscheme = 1*[ lowalpha | digit | “+” | “-” | “.” ]schemepart转载 2008-03-11 19:17:00 · 959 阅读 · 0 评论 -
一种高性能分布式Web爬行器的设计与实现(二)
原文:1.1 Crawling Applications There are a number of different scenarios in which crawlers are used for data acquisition. We now describe a few examples and how they differ in the crawling strategi翻译 2008-03-17 19:10:00 · 1575 阅读 · 1 评论 -
常用正则表达式
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。匹配中文字符的正则表达式: [/u4e00-/u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^/x00-/xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:/n/s*/r评注:可转载 2008-03-25 18:31:00 · 504 阅读 · 0 评论