dom4j解析xml(sina rss xml)

首先我介绍一下dom4j解析方式和所使用的包:

\r\n

要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/
目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip

\r\n

解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要加入包jaxen-1.1-beta-7.jar.

\r\n

以下是相关操作:

\r\n

一.Document对象相关

\r\n

1.读取XML文件,获得document对象.
            SAXReader reader = new SAXReader();
            Document  document = reader.read(new File(\"input.xml\"));

\r\n

2.解析XML形式的文本,得到document对象.
            String text = \"<members></members>\";
            Document document = DocumentHelper.parseText(text);
3.主动创建document对象.
            Document document = DocumentHelper.createDocument();
            Element root = document.addElement(\"members\");// 创建根节点
二.节点相关

\r\n

1.获取文档的根节点.
Element rootElm = document.getRootElement();
2.取得某节点的单个子节点.
Element memberElm=root.element(\"member\");// \"member\"是节点名
3.取得节点的文字
String text=memberElm.getText();
也可以用:
String text=root.elementText(\"name\");这个是取得根节点下的name字节点的文字.

\r\n

4.取得某节点下名为\"member\"的所有字节点并进行遍历.
List nodes = rootElm.elements(\"member\");

\r\n

for (Iterator it = nodes.iterator(); it.hasNext();) {
   Element elm = (Element) it.next();
   // do something
}
5.对某节点下的所有子节点进行遍历.
            for(Iterator it=root.elementIterator();it.hasNext();){
                Element element = (Element) it.next();
                // do something
            }
6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement(\"age\");
7.设置节点文字.
ageElm.setText(\"29\");
8.删除某节点.
parentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点
三.属性相关.
1.取得某节点下的某属性
            Element root=document.getRootElement();   
            Attribute attribute=root.attribute(\"size\");// 属性名name
2.取得属性的文字
            String text=attribute.getText();
也可以用:
String text2=root.element(\"name\").attributeValue(\"firstname\");这个是取得根节点下name字节点的属性firstname的值.

\r\n

3.遍历某节点的所有属性
            Element root=document.getRootElement();   
            for(Iterator it=root.attributeIterator();it.hasNext();){
                Attribute attribute = (Attribute) it.next();
                String text=attribute.getText();
                System.out.println(text);
            }
4.设置某节点的属性和文字.
newMemberElm.addAttribute(\"name\", \"sitinspring\");
5.设置属性的文字
            Attribute attribute=root.attribute(\"name\");
            attribute.setText(\"sitinspring\");
6.删除某属性
            Attribute attribute=root.attribute(\"size\");// 属性名name
            root.remove(attribute);
四.将文档写入XML文件.
1.文档中全为英文,不设置编码,直接写入的形式.
XMLWriter writer = new XMLWriter(new FileWriter(\"output.xml\"));
writer.write(document);
writer.close();
2.文档中含有中文,设置编码格式写入的形式.
            OutputFormat format = OutputFormat.createPrettyPrint();
            format.setEncoding(\"GBK\");    // 指定XML编码       
            XMLWriter writer = new XMLWriter(new FileWriter(\"output.xml\"),format);
           
            writer.write(document);
            writer.close();
五.字符串与XML的转换
1.将字符串转化为XML
String text = \"<members> <member>sitinspring</member> </members>\";
Document document = DocumentHelper.parseText(text);
2.将文档或节点的XML转化为字符串.
            SAXReader reader = new SAXReader();
            Document  document = reader.read(new File(\"input.xml\"));           
            Element root=document.getRootElement();               
            String docXmlText=document.asXML();
            String rootXmlText=root.asXML();
            Element memberElm=root.element(\"member\");
            String memberXmlText=memberElm.asXML();
六.使用XPath快速找到节点.
读取的XML文档示例
<?xml version=\"1.0\" encoding=\"UTF-8\"?>
<projectDescription>
  <name>MemberManagement</name>
  <comment></comment>
  <projects>
    <project>PRJ1</project>
    <project>PRJ2</project>
    <project>PRJ3</project>
    <project>PRJ4</project>
  </projects>
  <buildSpec>
    <buildCommand>
      <name>org.eclipse.jdt.core.javabuilder</name>
      <arguments>
      </arguments>
    </buildCommand>
  </buildSpec>
  <natures>
    <nature>org.eclipse.jdt.core.javanature</nature>
  </natures>
</projectDescription>

\r\n

使用XPath快速找到节点project.
 public static void main(String[] args){
    SAXReader reader = new SAXReader();
   
    try{
      Document  doc = reader.read(new File(\"sample.xml\"));
     
      List projects=doc.selectNodes(\"/projectDescription/projects/project\");
     
      Iterator it=projects.iterator();
     
      while(it.hasNext()){
        Element elm=(Element)it.next();      
        System.out.println(elm.getText());
      }
     
    }
    catch(Exception ex){
       ex.printStackTrace();
    }
  }

\r\n

 

\r\n

现在介绍我根据以上介绍解析http://rss.sina.com.cn/news/marquee/ddt.xml

\r\n

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

\r\n

import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpException;
import org.apache.commons.httpclient.methods.GetMethod;
import org.apache.commons.httpclient.params.HttpMethodParams;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

\r\n

import com.*.model.entity.RssChannel;
import com.*.model.entity.RssItem;

\r\n


public class RSSservice {

\r\n

  /**
  * 解析rssURL获取RSS2.0的xml文件
  * @param is
  */
 public RssChannel parseRssXml(InputStream is)
 {
  RssChannel rssChannel = new RssChannel();
  //读取XML文件,获得document对象.
  SAXReader reader = new SAXReader();
  Document doc = null;
  try {
   doc = reader.read(is);
   //System.out.println(doc.selectSingleNode(\"rss/channel/title\").getText().trim());
   //获取文档的根节点.
   Element element = doc.getRootElement();
   //取得某节点的单个子节点并取得节点的文字
   String title = element.selectSingleNode(\"channel/title\").getText();
   if(title !=null)
   {
    rssChannel.setTitle(title.trim());
   }
   String imgURL = element.selectSingleNode(\"channel/image/url\").getText();
   if(imgURL != null)
   {
    rssChannel.setImageURL(imgURL);
   }
   String description = element.selectSingleNode(\"channel/description\").getText();
   if(description != null)
   {
    rssChannel.setDescription(description.trim());
   }
   String language = element.selectSingleNode(\"channel/language\").getText();
   if(language != null)
   {
    rssChannel.setLanguage(language);
   }
   String pubDate = element.selectSingleNode(\"channel/pubDate\").getText();
   if(pubDate != null)
   {
    rssChannel.setPubDate(pubDate);
   }
   String category = element.selectSingleNode(\"channel/category\").getText();
   if(category != null)
   {
    rssChannel.setCategory(category);
   }
   String generator = element.selectSingleNode(\"channel/generator\").getText();
   if(generator != null)
   {
    rssChannel.setGenerator(generator);
   }
   List listItem = new ArrayList();
   List nodes = element.selectNodes(\"channel/item\");
   for (Iterator iter = nodes.iterator(); iter.hasNext();)
   {
    Element itemElement = (Element) iter.next();
    if(itemElement != null)
    {
     RssItem rssItem = new RssItem();
     String itemTitle = itemElement.selectSingleNode(\"title\").getText();
     if(itemTitle != null)
     {
      rssItem.setTitle(itemTitle.trim());
     }
     String link = itemElement.selectSingleNode(\"link\").getText();
     if(link != null)
     {
      rssItem.setLink(link);
     }
     String author = itemElement.selectSingleNode(\"author\").getText();
     if(author != null)
     {
      rssItem.setAuthor(author);
     }
     String categoryItem = itemElement.selectSingleNode(\"category\").getText();
     if(categoryItem != null)
     {
      rssItem.setCategory(categoryItem);
     }
     String pubDateItem = itemElement.selectSingleNode(\"pubDate\").getText();
     if(pubDateItem != null)
     {
      rssItem.setPubDate(pubDateItem);
     }
     String comments = itemElement.selectSingleNode(\"comments\").getText();
     if(comments != null)
     {
      rssItem.setComments(comments.trim());
     }
     String descriptionItem = itemElement.selectSingleNode(\"description\").getText();
     if(descriptionItem != null)
     {
      rssItem.setDescription(descriptionItem.trim());
     }
     listItem.add(rssItem);
    }
    rssChannel.setRssItem(listItem);
   }
  } catch (DocumentException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
  return rssChannel;
 }

\r\n

//test
 public static void main(String[] args)
 {
  RSSservice rssService = new RSSservice();
  String rssUrl = rssService.getRssURL(\"sina\");
  //String RssData = rssService.getRssContent(rssUrl);
  InputStream is = rssService.getRssContent(rssUrl);
  RssChannel rssChannel = rssService.parseRssXml(is);
  System.out.println(rssChannel);
 }
}

\r\n

解析所需的包http://download.csdn.net/source/3409103下载

');insert into `ArticleContent` (`ArticleId`, `Content`) values('6605209','

 jdbc连接数据库大全:

一、JDBC连接DB2
Class.forName("Com.ibm.db2.jdbc.net.DB2Driver");
String url="jdbc:db2://dburl:port/DBname"
cn = DriverManager.getConnection( url, sUsr, sPwd );

二、JDBC连接Microsoft SQLServer(microsoft)
Class.forName( "com.microsoft.jdbc.sqlserver.SQLServerDriver" );
cn = DriverManager.getConnection( "jdbc:microsoft:sqlserver://DBServerIP:1433;databaseName=master", sUsr, sPwd );

三、JDBC连接Sybase(jconn2.jar)
Class.forName( "com.sybase.jdbc2.jdbc.SybDriver" );
cn = DriverManager.getConnection( "jdbc:sybase:Tds:DBServerIP:2638", sUsr, sPwd );

四、JDBC连接MySQL(mm.mysql-3.0.2-bin.jar)
Class.forName( "org.gjt.mm.mysql.Driver" );
cn = DriverManager.getConnection( "jdbc:mysql://DBServerIP:3306/myDatabaseName", sUsr, sPwd );

五、JDBC连接PostgreSQL(pgjdbc2.jar)
Class.forName( "org.postgresql.Driver" );
cn = DriverManager.getConnection( "jdbc:postgresql://DBServerIP/myDatabaseName", sUsr, sPwd );

六、JDBC连接Oracle(classes12.jar)
Class.forName( "oracle.jdbc.driver.OracleDriver" );
cn = DriverManager.getConnection( "jdbc:oracle:thin:@MyDbComputerNameOrIP:1521:ORCL", sUsr, sPwd );

七、JDBC连接ODBC
Class.forName( "sun.jdbc.odbc.JdbcOdbcDriver" );
Connection cn = DriverManager.getConnection( "jdbc:odbc:" + sDsn, sUsr, sPwd );

注意:异常需要捕获并处理;URL符合jdbc协议。

这些可以在网上也能找到。

创建一个Statement   

    •要执行SQL语句,必须获得java.sql.Statement实例,Statement实例分为以下3   种类型:   

      1、执行静态SQL语句。通常通过Statement实例实现。   

      2、执行动态SQL语句。通常通过PreparedStatement实例实现。   

      3、执行数据库存储过程。通常通过CallableStatement实例实现。   

    具体的实现方式:   

        Statement stmt = con.createStatement() ;   

       PreparedStatement pstmt = con.prepareStatement(sql) ;   

       CallableStatement cstmt =   con.prepareCall("{CALL demoSp(? , ?)}") ;   

 

执行SQL语句   

    Statement接口提供了三种执行SQL语句的方法:executeQuery 、executeUpdate 和execute   

    1、ResultSet executeQuery(String sqlString):执行查询数据库的SQL语句,返回一个结果集(ResultSet)对象。   

     2int executeUpdate(String sqlString):用于执行INSERT、UPDATE或  DELETE语句以及SQL DDL语句,如:CREATE TABLE和DROP TABLE等   

     3、execute(sqlString):用于执行返回多个结果集、多个更新计数或二者组合的  语句。   

   具体实现的代码:   

          ResultSet rs = stmt.executeQuery("SELECT * FROM ...") ;   

    int rows = stmt.executeUpdate("INSERT INTO ...") ;   

    boolean flag = stmt.execute(String sql) ;   

 

处理结果   

    两种情况:   

     1、执行更新返回的是本次操作影响到的记录数。   

     2、执行查询返回的结果是一个ResultSet对象。   

    • ResultSet包含符合SQL语句中条件的所有行,并且它通过一套get方法提供了对这些   

      行中数据的访问。   

    • 使用结果集(ResultSet)对象的访问方法获取数据:   

     while(rs.next()){   

         String name = rs.getString("name") ;   

    String pass = rs.getString(1) ; // 此方法比较高效   

     }   

    (列是从左到右编号的,并且从列1开始)   

 关闭JDBC对象    

     操作完成以后要把所有使用的JDBC对象全都关闭,以释放JDBC资源,关闭顺序和声明顺序相反:   

     1、关闭记录集   

     2、关闭声明   

     3、关闭连接对象   

          if(rs != null){   // 关闭记录集   

        try{   

            rs.close() ;   

        }catch(SQLException e){   

            e.printStackTrace() ;   

        }   

          }   

          if(stmt != null){   // 关闭声明   

        try{   

            stmt.close() ;   

        }catch(SQLException e){   

            e.printStackTrace() ;   

        }   

          }   

          if(conn != null){  // 关闭连接对象   

         try{   

            conn.close() ;   

         }catch(SQLException e){   

            e.printStackTrace() ;   

         }   

          }  

也可以和在一起关

          try{   

   if(rs != null){   // 关闭记录集   

rs.close() ;   

   if(stmt != null){   // 关闭声明   

   stmt.close() ;   

}

if(conn != null){  // 关闭连接对象   

            conn.close() ;   

 } 

 

         }catch(SQLException e){   

            e.printStackTrace() ;   

         }   

          

 

 

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值