J2ME平台解析WAP网页

  

  做了两年多的J2ME平台手机应用开发,从刚入行的一个菜鸟,到现在对新项目的驾轻就熟,过程即苦涩,又幸福。想必每个开发人员都有着深刻的体会。

 

  每个新的项目都伴随着新的领域和新的问题,大家在遇到这些问题也是习惯性的通过WEB网页Google一下。其实对于Java平台的一些知识点上网查资料还是很方便就能查到的,毕竟这是一个开源的平台。虽然网上有着很多优秀的资源可以利用,但是每个项目的不同,也造就了“具体问题,具体分析”。并且,也有很多的技术点由于受到公司的知识产权的问题也无法做到开源。

 

  今天,我就把一个自己写的WAP解析器给大家做个开源,目的就是希望起到一个抛砖引玉的作用,启发大家的逻辑思维能力。

 

  本解析器是基于sax原理(不知道的上网查查就清楚了)

private int reciveWapData() {

 synchronized(this){

InputStream is = null;

 int responseCode = 0;

 try {

responseCode = wapConnection.getResponseCode();

} catch (IOException e) {

 // TODO Auto-generated catch block

e.printStackTrace();

}

switch (responseCode) {

case HttpConnection.HTTP_OK:

 try {

 is = wapConnection.openInputStream();

mimeType = getMimeType(wapConnection);

if (mimeType != null && mimeType.length() > 0) {

while (isParser) {

if (parserHtml(is)) {

 parserTag(is);

}

}

}

} catch (IOException e) {

// TODO Auto-generated catch block

 e.printStackTrace(); } break;

case HttpConnection.HTTP_MOVED_PERM:

case HttpConnection.HTTP_MOVED_TEMP:

try {

 wapUrl = wapConnection.getHeaderField("location");

} catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); }

break;

}

return responseCode;

 }

}

 

 

 

 

   上面这段代码,是在获得HttpConnection对象以后,通过int code = getResponseCode();方法获得服务器返回的连接信息,通过这个code我们可以判断连接成功还是失败,或者是URL地址重新定向。如果服务器返回的信息是200的话,我们就可以进行解析WAP网页了。

 

    在贴下一段代码之前,我先讲解一下解析的逻辑,这有助于更好的读懂代码。

  

  客户端接收到的WAP页面,都是有多个不同的标签所组成的,所以解析页面就要从这些标签入手,

   例;

        <html>

               <head>

                     <title>百度一下,你就知道</title>

               </head>

        <html>

 上面这段代码,是一个比较简单的HTML的结构,那么我们大家可以看所有的标签都有一对尖括号 < 和 > 。好的,我们就从这个括号入手,对页面进行解析。 tagNameEndChars.put(new Character('>'), new Character('>')); tagNameEndChars.put(new Character(' '), new Character(' '));

 

 

 首先,把停止读取的字符放入到一个table中去,

 

 

 

 

while (isParser) { if (parserHtml(is)) { parserTag(is); } }

 

 

 

 

 

上面代码中的这一部分,就是一个循环解析标签的过程,isParser是整个解析过程的停止标志,只有读到-1的时候,isParser = false;

 

boolean parserHtml(InputStream is) { int i = 0; try { do { i = is.read(); char c = (char) i; if (c == '<') { endChar = c; return true; }else { if (i <= 32 && i > 0) { return false; } else { endInt = i; endChar = c; if(readCssTagValue(is, '<')){ return true; } } } } while (i != -1); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } if(i<0){ isParser = false; } return false; }

 

 

 

 

   这一部分,是解析开始标签的方法,其中,endChar是最后读取的字符,这个变量非常重要,所以要用一个全局变量来进行控制,其他的逻辑已经很清楚,就不在多讲了。

 

void parserTag(InputStream is) { String tagData = null;//标签 String hyperLink = null;//超链接 boolean isTagEnd = false; int i = readOneChar(is); char c = (char)i; if(endChar == '<'){ if(c == '/'){ try { isTagEnd = true; tagData = readUntil(is, tagNameEndChars); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } setEndTag(tagData); System.out.println("结束标签:"+tagData); }else if(c == '!'){ try{ skipComment(is); return ; }catch(Exception e){ e.printStackTrace(); } }else{ try { isTagEnd = false; tagData = c + readUntil(is, tagNameEndChars); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } setStartTag(tagData); System.out.println("开始标签:"+tagData); if(endChar == CssTag.BLANK){ link = hyperLink = readUntil(is, CssTag.BRACKET_RIGHT); System.out.println("超链接:"+hyperLink); } } } byte tagId = CssTag.symbolAsInt(tagData); // System.out.println("标签类型======================================"+tagId); if(tagId == 0) { if(endChar != '>') { skipUntil(is, ">"); //skip rest of tag } WmlTag tag = new WmlTag(tagId); tag.setStartTag(isTagEnd); onTagReceived(tag,hyperLink,link); }

 

 

 

 

   这段代码就是解析结束标签,以及标签属性的方法,

 

   大家也看到了,就是这些方法当中都将InputStream这个对象传入到了方法中,这个输入流结合endChar还有tagNameEndChars,来控制要读取字符的长度。方法中的skipUntil();和onTagreceived();是跳过一定长度字符的方法和将标签转为可视的对象的方法,这些我就不贴代码了,因为这些不是解析器的关键。

 

  好了,到现在一个解析器就完成了,虽然说代码不是很全,不过只要能够理解其中的原理,在通过自己的动手,一个属于你自己的WAP解析器也会孕育而生。

 

第一次发表文章,所以代码贴的不太规范,请大家见谅,自己做一些整理。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值