网站sickipedia 笑话抓取程序

应宿舍一哥们邀请,写了一个简单的网站笑话抓取程序,不用看一个笑话就重刷整个网页了。大笑

发现有时用浏览器打不开网站,网速卡的时候,但是用程序还是可以拿得到,貌似java很牛叉!

简单写了一下,没有考虑太多,别捡砖头啊!

 

package com.alec;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.HashMap;
import java.util.Map;

public class Test {
	
	private static int sum=200;
	private static Map<String,String> jokes=new HashMap<String,String>();
	private static String jokeID;
	
	/**
	 * @param args
	 * @throws Exception 
	 */
	public static void main(String[] args) throws Exception {
		// TODO Auto-generated method stub 
		
		Test t=new Test();
		while(sum-->0){
			t.getJokes("http://www.sickipedia.org/getjokes/random#");
		}
		t.printJokes();
	}
	
	public void getJokes(String urlString){
		URL url;
		try {
			url = new URL(urlString);
			BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(), "utf-8"));
		     
	        String line = reader.readLine();
	        while (line != null) {
	        	line=line.trim();
	        	if(line.startsWith("<div style='display:none'>")){
	        		jokeID=line.substring(line.indexOf(">")+1,line.lastIndexOf("<"));
	        	}else if(line.startsWith("<td style='color: #000000'>")){
	        		line = reader.readLine().trim();
	        		String temp=reader.readLine().trim();
	        		while(!temp.startsWith("</td>")){
	        			line = line + temp;
	        			temp=reader.readLine().trim();
	        		}
	        		jokes.put(jokeID, line.replace("<br />", " "));
	        	}
	        	line = reader.readLine();
	        }
		} catch (MalformedURLException e) {
			System.out.println("URL format not right.");
			e.printStackTrace();
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
	
	public void printJokes(){
		for(String joke:jokes.keySet()){
			System.out.println("joke "+joke +" :" + jokes.get(joke));
		}
	}
}


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值