自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

爬虫抓网页知识小结

1,用于抓取时间date的 但是时间的格式多变 import java.util.regex.Matcher;import java.util.regex.Pattern; Pattern p = Pattern.compile("\\bon\\b");Matcher m = p.matcher(str);if(m.find()){ str = m.group(...

2011-11-11 15:10:05 112

登录微博的样例

import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.List;import org.apache.co...

2011-11-11 14:58:42 106

原创 Map List Set转

1.list转setJava代码 复制代码 1. Set set = new HashSet( new ArrayList()); Java代码 复制代码 1. Set set = new HashSet( new ArrayList()); Set set = new HashSet(new ArrayList()); ...

2011-05-20 10:12:22 95

原创 抓sohuBlog的时候碰到web zip形式

Gzip压缩了,用压缩输入流GZIPInputStream gzin = new GZIPInputStream(fin); // 得到压缩输入流 public static void unGZipFile(File source, String target) throws Exception { FileInputStream fin = new FileInputStr...

2011-05-13 13:35:42 83

原创 字符串去除html标签

[color=red] content=content.replaceAll("]+>",""); //剔出了的标签 content=content.replace(" ",""); content=content.replace(".",""); conte

2011-05-13 12:30:30 109

原创 HTMLParser使用详解(3)- 通过Filter访问内容【转】

项目用到 转来存着 谢谢HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。(一)Filter类顾名思义,Filter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义了16个不同的Filter,也可以分为几类。...

2011-03-18 17:36:05 65

原创 HTMLParser使用详解(2)- Node内容【转】

项目用到 转来存着 谢谢HTMLParser将解析过的信息保存为一个树的结构。Node是信息保存的数据类型基础。请看Node的定义:public interface Node extends Cloneable;Node中包含的方法有几类:对于树型结构进行遍历的函数,这些函数最容易理解:Node getParent ():取得父节点NodeList getChild...

2011-03-18 17:34:25 114

原创 HTMLParser使用详解(1)- 初始化Parser[转]

因为在项目中用到 然后转来存着在研究搜索引擎的开发中,对于HTML网页的处理是核心的一个环节。网上有很多开源的代码,对于Java来说,HTMLParser是比较著名并且得到广泛应用的一个。HTMLParser的主页是http://htmlparser.sourceforge.net/,最后的更新是 2006年9月的1.6版。不过没关系,HTML的内容已经很久没有大的变化了,HTMLParser...

2011-03-18 17:32:24 101

原创 Htmlparser Filter 简要归纳(转)

1 . 逻辑关系:与或非AndFilter() Creates a new instance of an AndFilter.AndFilter(NodeFilter[] predicates) Creates an AndFilter that accepts nodes acceptable to all given filters.An...

2011-03-18 17:26:16 84

原创 HttpClient的 post 、get使用方法(转)

Http学习之使用HttpURLConnection发送post和get请求2010-02-23 16:08Http学习之使用HttpURLConnection发送post和get请求最常用的Http请求无非是get 和post,get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet,post与get的不同之处在于post的参数不是放在URL字串里面,而是放在...

2011-03-18 13:37:22 133

原创 文件操作大全(转的)

1.创建文件夹//import java.io.*;File myFolderPath = new File(%%1);try {if (!myFolderPath.exists())myFolderPath.mkdir();}catch (IOException e) {System.err.println("新建目录操作出错");}2.创建文件/...

2011-03-16 15:08:56 81

原创 Groovy探索 关于“Load my Resource”模式的解读

声明: 转自软件信雅达很早就在Groovy语言的官方文档上看到了“Load my Resource”模式,却一直没有在意,可能是因为它不是GOF的经典模式中的一种。最近又不经意的看到了它,却鬼使神差的大概看了一遍,当略略有点明白它的意思时,就有点惊奇于它的功能了,当再一次阅读时,静下心来想一想,就真正感叹于它的思想了。总体来说,这个模式主要是针对一些资源的使用来的。这些资源包括文件...

2011-02-24 13:53:41 168

原创 eclipse自动提示设置

从Window -> preferences -> Java -> Editor -> Content assist -> Auto-Activation下,我们可以在"."号后面加入我们需要自动提示的首字幕,比如"west"。在"."后面随便输入几个字符,比如"abij",然后回到开发环境,File -> export -> general -> preferences -&

2011-02-24 11:09:43 86

原创 Groovy Tip 10 Groovy语言对String的简化操作

声明:转自 软件信雅达在Groovy语言中,对String对象的操作就像操作List对象一样的方便。比如我们在Java语言中,对String对象的操作用得比较多的是substring方法。如下: String str = "abcdefg"; System.out.println(str.substring(1,3)); 结果为:bc...

2011-02-23 17:33:33 140

原创 Groovy探索之Gstring(转摘)

声明:转自:软件信雅达Groovy语言里有很多看起来不起眼的小玩意,但使用以后,我们却常常会惊异于它的巨大能量,Gstring就是其中之一。Java的String对象是我们最最常用的对象,却也是诟病最多的对象。一句话来说,String使用起来非常不方便。而Gstring不但使用方便,而且更是Groovy语言动态性的基础。所谓Gstring,是指通过双引号引起来的、带有占位表达式...

2011-02-23 17:11:54 425

Groovy的方法小结

// normal stringsdeffirstname= 'Kate'defsurname= "Bush"assertfirstname* 2== 'KateKate'// GStringdeffullname= "$firstname$surname"assertfullname== 'Kate Bush'assertfullname-firstname== ' ...

2011-02-23 15:43:58 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除