网站sickipedia 笑话抓取程序

应宿舍一哥们邀请,写了一个简单的网站笑话抓取程序,不用看一个笑话就重刷整个网页了。大笑

发现有时用浏览器打不开网站,网速卡的时候,但是用程序还是可以拿得到,貌似java很牛叉!

简单写了一下,没有考虑太多,别捡砖头啊!

 

package com.alec;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.HashMap;
import java.util.Map;

public class Test {
	
	private static int sum=200;
	private static Map<String,String> jokes=new HashMap<String,String>();
	private static String jokeID;
	
	/**
	 * @param args
	 * @throws Exception 
	 */
	public static void main(String[] args) throws Exception {
		// TODO Auto-generated method stub 
		
		Test t=new Test();
		while(sum-->0){
			t.getJokes("http://www.sickipedia.org/getjokes/random#");
		}
		t.printJokes();
	}
	
	public void getJokes(String urlString){
		URL url;
		try {
			url = new URL(urlString);
			BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(), "utf-8"));
		     
	        String line = reader.readLine();
	        while (line != null) {
	        	line=line.trim();
	        	if(line.startsWith("<div style='display:none'>")){
	        		jokeID=line.substring(line.indexOf(">")+1,line.lastIndexOf("<"));
	        	}else if(line.startsWith("<td style='color: #000000'>")){
	        		line = reader.readLine().trim();
	        		String temp=reader.readLine().trim();
	        		while(!temp.startsWith("</td>")){
	        			line = line + temp;
	        			temp=reader.readLine().trim();
	        		}
	        		jokes.put(jokeID, line.replace("<br />", " "));
	        	}
	        	line = reader.readLine();
	        }
		} catch (MalformedURLException e) {
			System.out.println("URL format not right.");
			e.printStackTrace();
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
	
	public void printJokes(){
		for(String joke:jokes.keySet()){
			System.out.println("joke "+joke +" :" + jokes.get(joke));
		}
	}
}


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
、空间为ASP式空间,本站上传就可以使用! 2、管理地址为http://你的网址/admin 3、帐号为:admin 密码为123456 4、GOOGLE广告可以投放三处。 最上面的是468*60的 替换方式就在后台找“标签”,然后选择头部,替换如下代码: <script type="text/javascript"><!-- google_ad_client = "pub-4529826688475748"; /* 468x60, 创建于 08-9-1 */ google_ad_slot = "6671690803"; google_ad_width = 468; google_ad_height = 60; //--> </script> <script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script> 其次为链接单元广告,这个为728*15的,这个也是在标签里面的头部里面替换,替换的是下面的: <script type="text/javascript"><!-- google_ad_client = "pub-4529826688475748"; /* 728x15, 创建于 08-8-31 */ google_ad_slot = "5539120582"; google_ad_width = 728; google_ad_height = 15; //--> </script> <script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script> 右边的广告位200*200的,这个在标签里找寻“左侧广告位”,然后替换掉里面的代码就可以了。 5、添加友情链接在标签里面,为友情链接。 6、上传以后,先登陆后台,然后在配置里面,把“站内链接前缀:Httpurl ”换成你的网址。 7、然后选择静态发布,分别“生成首页”、生成栏目页。 8、发布文章以后,必须要点静态发布,才能够在首页上显示。 9、网页内容页支持键盘的左右键盘的切换。 10、为了安全,请修改您的管理员密码以及管理路径。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值