J2ME平台解析WAP网页

最新推荐文章于 2022-02-25 18:19:43 发布

AlexZheng_Blog

最新推荐文章于 2022-02-25 18:19:43 发布

阅读量122

点赞数

文章标签： WAP C++ C C# 百度

本文链接：https://blog.csdn.net/AlexZheng_Blog/article/details/83553606

版权

做了两年多的J2ME平台手机应用开发，从刚入行的一个菜鸟，到现在对新项目的驾轻就熟，过程即苦涩，又幸福。想必每个开发人员都有着深刻的体会。

每个新的项目都伴随着新的领域和新的问题，大家在遇到这些问题也是习惯性的通过WEB网页Google一下。其实对于Java平台的一些知识点上网查资料还是很方便就能查到的，毕竟这是一个开源的平台。虽然网上有着很多优秀的资源可以利用，但是每个项目的不同，也造就了“具体问题，具体分析”。并且，也有很多的技术点由于受到公司的知识产权的问题也无法做到开源。

今天，我就把一个自己写的WAP解析器给大家做个开源，目的就是希望起到一个抛砖引玉的作用，启发大家的逻辑思维能力。

本解析器是基于sax原理（不知道的上网查查就清楚了）

private int reciveWapData() {

synchronized(this){

InputStream is = null;

int responseCode = 0;

try {

responseCode = wapConnection.getResponseCode();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

switch (responseCode) {

case HttpConnection.HTTP_OK:

try {

is = wapConnection.openInputStream();

mimeType = getMimeType(wapConnection);

if (mimeType != null && mimeType.length() > 0) {

while (isParser) {

if (parserHtml(is)) {

parserTag(is);

}

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace(); } break;

case HttpConnection.HTTP_MOVED_PERM:

case HttpConnection.HTTP_MOVED_TEMP:

try {

wapUrl = wapConnection.getHeaderField("location");

} catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); }

break;

}

return responseCode;

}

上面这段代码，是在获得HttpConnection对象以后，通过int code = getResponseCode();方法获得服务器返回的连接信息，通过这个code我们可以判断连接成功还是失败，或者是URL地址重新定向。如果服务器返回的信息是200的话，我们就可以进行解析WAP网页了。

在贴下一段代码之前，我先讲解一下解析的逻辑，这有助于更好的读懂代码。

客户端接收到的WAP页面，都是有多个不同的标签所组成的，所以解析页面就要从这些标签入手，

例；

<html>

<head>

</head>

<html>

上面这段代码，是一个比较简单的HTML的结构，那么我们大家可以看所有的标签都有一对尖括号 < 和 > 。好的，我们就从这个括号入手，对页面进行解析。 tagNameEndChars.put(new Character('>'), new Character('>')); tagNameEndChars.put(new Character(' '), new Character(' '));

首先，把停止读取的字符放入到一个table中去，

while (isParser) { if (parserHtml(is)) { parserTag(is); } }

上面代码中的这一部分，就是一个循环解析标签的过程，isParser是整个解析过程的停止标志，只有读到-1的时候，isParser = false;

boolean parserHtml(InputStream is) { int i = 0; try { do { i = is.read(); char c = (char) i; if (c == '<') { endChar = c; return true; }else { if (i <= 32 && i > 0) { return false; } else { endInt = i; endChar = c; if(readCssTagValue(is, '<')){ return true; } } } } while (i != -1); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } if(i<0){ isParser = false; } return false; }

这一部分，是解析开始标签的方法，其中，endChar是最后读取的字符，这个变量非常重要，所以要用一个全局变量来进行控制，其他的逻辑已经很清楚，就不在多讲了。

void parserTag(InputStream is) { String tagData = null;//标签 String hyperLink = null;//超链接 boolean isTagEnd = false; int i = readOneChar(is); char c = (char)i; if(endChar == '<'){ if(c == '/'){ try { isTagEnd = true; tagData = readUntil(is, tagNameEndChars); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } setEndTag(tagData); System.out.println("结束标签:"+tagData); }else if(c == '!'){ try{ skipComment(is); return ; }catch(Exception e){ e.printStackTrace(); } }else{ try { isTagEnd = false; tagData = c + readUntil(is, tagNameEndChars); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } setStartTag(tagData); System.out.println("开始标签:"+tagData); if(endChar == CssTag.BLANK){ link = hyperLink = readUntil(is, CssTag.BRACKET_RIGHT); System.out.println("超链接:"+hyperLink); } } } byte tagId = CssTag.symbolAsInt(tagData); // System.out.println("标签类型======================================"+tagId); if(tagId == 0) { if(endChar != '>') { skipUntil(is, ">"); //skip rest of tag } WmlTag tag = new WmlTag(tagId); tag.setStartTag(isTagEnd); onTagReceived(tag,hyperLink,link); }

这段代码就是解析结束标签，以及标签属性的方法，

大家也看到了，就是这些方法当中都将InputStream这个对象传入到了方法中，这个输入流结合endChar还有tagNameEndChars，来控制要读取字符的长度。方法中的skipUntil();和onTagreceived();是跳过一定长度字符的方法和将标签转为可视的对象的方法，这些我就不贴代码了，因为这些不是解析器的关键。

好了，到现在一个解析器就完成了，虽然说代码不是很全，不过只要能够理解其中的原理，在通过自己的动手，一个属于你自己的WAP解析器也会孕育而生。

第一次发表文章，所以代码贴的不太规范，请大家见谅，自己做一些整理。