android XML解析学习——android.Sax

一.基础知识
  在《OPhone XML解析学习--Sax方式》中我们学习了OPhone /Android上使用Java的SAX进行XML解析的方式。而在OPhone/Android平台上使用SAX解析XML,除了使用Java的API外,还可以使用OPhone/Android SDK带的API来实现。OPhone/Android SDK中和SAX解析相关的包为android.sax,在这个包中OPhone/Android提供了都有的SAX API,使用它们可以更加方便的进行SAX方式的XML解析。
  当xml文件中在不同的位置处有相同的元素标签名时,在相应的事件回调处理函数中往往就需要进行判断处理。比如USGS的xml形式的地震数据为:

  1. <?xml version="1.0"?>  
  2.   <feed xmlns="http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss">  
  3.   <updated>2010-09-15T04:41:18Z</updated>  
  4.   <title>USGS M2.5+ Earthquakes</title>  
  5.   <subtitle>Real-time, worldwide earthquake list for the past day</subtitle>  
  6.   <link rel="self" href="http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml"/>  
  7.   <link href="http://earthquake.usgs.gov/earthquakes/"/>  
  8.   <author><name>U.S. Geological Survey</name></author>  
  9.   <id>http://earthquake.usgs.gov/</id>  
  10.   <icon>/favicon.ico</icon>  
  11.   <entry>  
  12.      <id>urn:earthquake-usgs-gov:ak:10078833</id>  
  13.      <title>M 2.9, Southern Alaska</title>  
  14.      <updated>2010-09-15T04:14:03Z</updated>  
  15.      <link rel="alternate" type="text/html" href="http://earthquake.usgs.gov/earthquakes/recenteqsww/Quakes/ak10078833.php"/>  
  16.      <summary type="html">  
  17.     <![CDATA[<img src="http://earthquake.usgs.gov/images/globes/60_-155.jpg" alt="59.909&#176;N 153.124&#176;W" align="left" hspace="20" /><p>Wednesday, September 152010 04:14:03 UTC<br>Tuesday, September 142010 08:14:03 PM at epicenter</p><p><strong>Depth</strong>: 98.90 km (61.45 mi)</p>]]>  
  18.      </summary>  
  19.      <georss:point>59.9094 -153.1241</georss:point>  
  20.      <georss:elev>-98900</georss:elev>  
  21.      <category label="Age" term="Past hour"/>  
  22.   </entry>  
  23.   <entry>  
  24.    <!-- 还有entry条目,省略-->  
  25.   </entry>  
  26.   </feed>  


  我们看到在<entry>开始前就有<updated>、<title>和<link>等元素标签,而<entry></entry>元素中也包含这些标签名,在SAX解析时都会产生相应的事件,但我们实际需要处理的为<entry></entry>元素中的这些标签产生的事件,因此我们设置了一个变量
  private Boolean startEntryElementFlag = false;
  来进行判断。对以上的xml数据来说,这样的处理还不会出现问题,但是如果需要解析一个更加复杂的XML文档,则类似的需要对不同位置处的相同标签名进行判断这样的处理可能会带来各种各样的Bug。
  而使用android.sax包中的API来进行SAX方式的解析则不会有以上的问题。实际上使用android.sax包还有点结合了我们以后会详细介绍的DOM方式,首先获取需要解析部分的根元素,然后使用getChild方法获取具体的某个子元素,之后就可以为具体的元素设置事件处理的回调函数,比如为一个元素分别设置元素开始的事件处理setStartElementListener,元素包含的文本内容结束的事件处理setEndTextElementListener和元素结束的事件处理setEndElementListener。
  概括的来说,android.sax包进行XML解析的过程为用DOM的方式获取具体位置处的元素,然后为其设置需要的事件处理函数。具体的实现我们可以看实例开发部分的代码。
  OPhone/Android SDK中提供的和XML相关的还有一个类:android.util.Xml,在该类中提供了比较实用的XML相关的类方法,比如开始解析的parse方法,和直接创建XmlPullParser及XmlSerializer(这两块内容以后介绍)的方法等。

  下面我们就用上面介绍的OPhone/Android SDK中的SAX方式来实现解析XML形式的USGS地震数据的Demo例子。


  二.实例开发
  我们要完成的效果图如下图1所示:

  图1 ListView列表显示的地震数据


  和上一部分Demo例子的一样,也是解析完地震数据后用ListView列表的方式显示每条地震的震级和地名信息。
  新建一个OPhone工程OPhoneXMLDemoSaxII。
  添加进上一个Demo工程OPhoneXMLDemoSax中的EarthquakeEntry.java文件,如果需要从本地读取xml数据的话,同时在assets文件夹下添加保存为xml格式了的USGS地震数据USGS_Earthquake_1M2_5.xml,如果需要联网读取的话,在manifest.xml文件中添加权限:

  1. <uses-permission android:name="android.permission.INTERNET" />  
  2.   并修改res/layout下的main.xml为:  
  3.   <?xml version="1.0" encoding="utf-8"?>  
  4.   <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"  
  5.   android:orientation="vertical"  
  6.   android:layout_width="fill_parent"  
  7.   android:layout_height="fill_parent"  
  8.   >  
  9.   <ListView  
  10.   android:id="@+id/list"  
  11.   android:layout_width="fill_parent"   
  12.   android:layout_height="fill_parent"  
  13.   />  
  14.   </LinearLayout>  


 接下来就来新建添加一个类AndroidSaxEarthquakeHandler,以OPhone/Android SDK提供的包android.sdk的API来完成解析地震数据的具体逻辑实现,内容如下:

  1. public class AndroidSaxEarthquakeHandler {  
  2.    //xml解析用到的Tag  
  3.    private String kRootElementName = "feed";  
  4.    private String kEntryElementName = "entry";  
  5.    private String kLinkElementName = "link";  
  6.    private String kTitleElementName = "title";  
  7.    private String kUpdatedElementName = "updated";  
  8.    private String kGeoRSSPointElementName = "point";  
  9.    private String kGeoRSSElevElementName = "elev";  
  10.    static final String ATOM_NAMESPACE = "http://www.w3.org/2005/Atom";   
  11.    static final String GEORSS_NAMESPACE = "http://www.georss.org/georss";  
  12.    //用于保存xml解析获取的结果  
  13.    private ArrayList<EarthquakeEntry> earthquakeEntryList;  
  14.    private EarthquakeEntry earthquakeEntry;  
  15.      
  16.    //解析xml数据  
  17.    public ArrayList<EarthquakeEntry> parse(InputStream inStream)  
  18.    {  
  19.     earthquakeEntryList = new ArrayList<EarthquakeEntry>();  
  20.     RootElement root = new RootElement(ATOM_NAMESPACE, kRootElementName);  
  21.     Element entry = root.getChild(ATOM_NAMESPACE, kEntryElementName);  
  22.     //具体解析xml  
  23.     //处理entry标签  
  24.     entry.setStartElementListener(new StartElementListener() {    
  25.      @Override  
  26.      public void start(Attributes attributes) {  
  27.       // TODO Auto-generated method stub  
  28.       earthquakeEntry = new EarthquakeEntry();  
  29.      }  
  30.     });  
  31.     entry.setEndElementListener(new EndElementListener() {   
  32.      @Override  
  33.      public void end() {  
  34.       // TODO Auto-generated method stub  
  35.       earthquakeEntryList.add(earthquakeEntry);  
  36.      }  
  37.     });  
  38.     //处理title标签  
  39.     entry.getChild(ATOM_NAMESPACE, kTitleElementName).setEndTextElementListener(new EndTextElementListener() {  
  40.      @Override  
  41.      public void end(String currentData) {  
  42.       // TODO Auto-generated method stub  
  43.          //提取强度信息  
  44.          String magnitudeString = currentData.split(" ")[1];  
  45.          int end =  magnitudeString.length()-1;  
  46.          magnitudeString = magnitudeString.substring(0, end);  
  47.          double magnitude = Double.parseDouble(magnitudeString);  
  48.          earthquakeEntry.setMagnitude(magnitude);  
  49.          //提取位置信息  
  50.          String place = currentData.split(",")[1].trim();  
  51.          earthquakeEntry.setPlace(place);      
  52.      }  
  53.     });  
  54.     //处理updated标签  
  55.     entry.getChild(ATOM_NAMESPACE, kUpdatedElementName).setEndTextElementListener(new EndTextElementListener() {  
  56.      @Override  
  57.      public void end(String currentData) {  
  58.       // TODO Auto-generated method stub  
  59.       //构造更新时间  
  60.       SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss'Z'");  
  61.       Date qdate = new GregorianCalendar(0,0,0).getTime();  
  62.             try {  
  63.            qdate = sdf.parse(currentData);  
  64.          } catch (ParseException e) {  
  65.            e.printStackTrace();  
  66.          }  
  67.          earthquakeEntry.setDate(qdate);      
  68.      }  
  69.     });  
  70.     //处理point标签  
  71.     entry.getChild(GEORSS_NAMESPACE, kGeoRSSPointElementName).setEndTextElementListener(new EndTextElementListener() {   
  72.      @Override  
  73.      public void end(String currentData) {  
  74.       // TODO Auto-generated method stub  
  75.       //提取经纬度信息  
  76.          String[] latLongitude = currentData.split(" ");  
  77.          Location location = new Location("dummyGPS");  
  78.          location.setLatitude(Double.parseDouble(latLongitude[0]));  
  79.          location.setLongitude(Double.parseDouble(latLongitude[1]));  
  80.          earthquakeEntry.setLocation(location);  
  81.      }  
  82.     });  
  83.     //处理elev标签  
  84.     entry.getChild(GEORSS_NAMESPACE, kGeoRSSElevElementName).setEndTextElementListener(new EndTextElementListener() {  
  85.      @Override  
  86.      public void end(String currentData) {  
  87.       // TODO Auto-generated method stub  
  88.          //提取海拔高度信息  
  89.       double evel;  
  90.       //因为USGS数据有可能会输错,比如为"--10000",多了一个"-"号  
  91.          try {  
  92.           evel = Double.parseDouble(currentData);  
  93.       } catch (Exception e) {  
  94.        // TODO: handle exception  
  95.        e.printStackTrace();  
  96.        evel = 0;  
  97.       }  
  98.          Log.v("Sax_Elev", String.valueOf(evel));  
  99.          earthquakeEntry.setElev(evel);     
  100.      }  
  101.     });  
  102.     //处理link标签  
  103.     entry.getChild(ATOM_NAMESPACE, kLinkElementName).setStartElementListener(new StartElementListener() {    
  104.      @Override  
  105.      public void start(Attributes attributes) {  
  106.       // TODO Auto-generated method stub  
  107.       //获取link链接  
  108.       String webLink = attributes.getValue("href");  
  109.       earthquakeEntry.setLink(webLink);  
  110.      }  
  111.     });  
  112.     //调用android.util.Xml开始解析  
  113.     try {  
  114.      Xml.parse(inStream, Xml.Encoding.UTF_8, root.getContentHandler());  
  115.     } catch (Exception e) {  
  116.      // TODO Auto-generated catch block  
  117.      e.printStackTrace();  
  118.     }  
  119.       
  120.     return earthquakeEntryList;  
  121.    }  
  122.   }  


  开头处定义了解析需要的元素标签名称,因为getChild方法获取子元素时需要命名空间,因此还新定义了USGS的xml数据中包含的两个命名空间:
   static final String ATOM_NAMESPACE = "http://www.w3.org/2005/Atom"; 
   static final String GEORSS_NAMESPACE = "http://www.georss.org/georss";
  在定义的用于解析xml数据的方法中
  public ArrayList<EarthquakeEntry> parse(InputStream inStream)
  首先获取xml文档的根元素:
  RootElement root = new RootElement(ATOM_NAMESPACE, kRootElementName);
  有了根元素之后,就可以使用类似DOM的getChild方法获取具体的某个位置处的子元素,并且可以为具体的子元素注册事件处理器和在对应的回调函数中实现具体的处理逻辑。
  从程序中我们可以看到,我们只为<entry>元素和<entry></entry>包含的子元素注册了事件处理器,因此即使xml文档开始处有<updated>、<title>和<link>等同名的元素标签,但也不会进行处理。因此和上一部分的Demo相比,就不再需要设置标志变量用来判断,而且看起来也更加简单了。
  虽然写法不同了,但是对具体标签的处理逻辑和上一部分Demo中是一样的,因为处理的xml文档内容没有变。
  程序的最后调用android.util.Xml类的类方法parse直接进行解析,也更加方便了。

  1. //调用android.util.Xml开始解析  
  2.    try {  
  3.     Xml.parse(inStream, Xml.Encoding.UTF_8, root.getContentHandler());  
  4.    } catch (Exception e) {  
  5.     // TODO Auto-generated catch block  
  6.     e.printStackTrace();  
  7.    }  


   其中Xml类parse方法的ContentHandler参数由根元素通过getContentHandler()方式获得。
  最后添加OPhoneXMLDemoSaxII.java文件中的内容,内容和上一个Demo工程OPhoneXMLDemoSax中的OPhoneXMLDemoSax.java基本一样,

  1. public class OPhoneXMLDemoSaxII extends Activity {  
  2.   /** Called when the activity is first created. */  
  3.    //定义显示的List相关变量  
  4.    ListView list;  
  5.    ArrayAdapter<EarthquakeEntry> adapter;  
  6.    ArrayList<EarthquakeEntry> earthquakeEntryList;  
  7.   @Override  
  8.   public void onCreate(Bundle savedInstanceState) {  
  9.   super.onCreate(savedInstanceState);  
  10.   setContentView(R.layout.main);  
  11.   
  12.   //获取地震数据流  
  13.   InputStream earthquakeStream = readEarthquakeDataFromFile();  
  14.   //Android Sax方式进行解析  
  15.   AndroidSaxEarthquakeHandler androidSaxHandler = new AndroidSaxEarthquakeHandler();  
  16.   earthquakeEntryList = androidSaxHandler.parse(earthquakeStream);  
  17.     //用ListView进行显示  
  18.     list = (ListView)this.findViewById(R.id.list);  
  19.     adapter = new ArrayAdapter<EarthquakeEntry>(this, android.R.layout.simple_list_item_1, earthquakeEntryList);  
  20.     list.setAdapter(adapter);  
  21.   }  
  22.   
  23.   private InputStream readEarthquakeDataFromFile()  
  24.   {  
  25.     //从本地获取地震数据  
  26.     InputStream inStream = null;  
  27.     try {  
  28.      inStream = this.getAssets().open("USGS_Earthquake_1M2_5.xml");  
  29.     } catch (IOException e) {  
  30.      // TODO Auto-generated catch block  
  31.      e.printStackTrace();  
  32.     }  
  33.     return inStream;  
  34.   }  
  35.   private InputStream readEarthquakeDataFromInternet()  
  36.   {  
  37.    //从网络上获取实时地震数据  
  38.    URL infoUrl = null;  
  39.    InputStream inStream = null;  
  40.    try {  
  41.      infoUrl = new URL("http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml");  
  42.      URLConnection connection = infoUrl.openConnection();  
  43.      HttpURLConnection httpConnection = (HttpURLConnection)connection;  
  44.      int responseCode = httpConnection.getResponseCode();  
  45.      if(responseCode == HttpURLConnection.HTTP_OK)  
  46.      {  
  47.       inStream = httpConnection.getInputStream();  
  48.      }  
  49.     } catch (MalformedURLException e) {  
  50.      // TODO Auto-generated catch block  
  51.      e.printStackTrace();  
  52.     } catch (IOException e) {  
  53.      // TODO Auto-generated catch block  
  54.      e.printStackTrace();  
  55.     }  
  56.     return inStream;  
  57.   }  
  58.   }  

  只是把进行SAX解析的部分换成了如下方式:

  1. //Android Sax方式进行解析  
  2.   AndroidSaxEarthquakeHandler androidSaxHandler = new AndroidSaxEarthquakeHandler();  
  3.   earthquakeEntryList = androidSaxHandler.parse(earthquakeStream);  


  完成了,可以保存运行看下效果。

  三.总结
  OPhone/Android平台提供了相当强大的XML解析支持,不仅包含了Java SDK中用来XML处理的API,而且OPhone/Android SDK还提供了特有的用于SAX解析XML的包android.sax。使用这个包中的API可以更加方便解析,特别是当要解析的xml文档中在不同的层级位置处有多个相同名称的标签但需要分别进行不同处理时,同时也有更好的鲁棒性,减少解析时产生Bug的可能性。
  以上我们介绍的都是SAX方式解析XML,而解析XML常用的还有DOM方式,这部分内容我们以后接着学习。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值