用mysql打一段代码_一段MYSQL的插入代码

两个Java程序展示了如何使用Jsoup库抓取网页内容,解析HTML,找到链接并保存到数据库中。程序一从指定URL抓取页面,提取链接,并将链接信息存储到数据库。程序二同样抓取网页,但侧重于查找特定元素如'尾页'的链接。两个程序都使用了crawldata类来处理数据库连接和数据保存。
摘要由CSDN通过智能技术生成

程序一:

import java.io.File;

import java.io.IOException;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

public class crawltest1 {

private crawldata op;

public crawltest1(){

this.op = new crawldata();

}

public static void main(String[] args) {

crawltest1 t = new crawltest1();

t.parseUrl();

}

public void parseString() {

String url = "http://……";//文章来源网站名称。

Document doc = Jsoup.parse(url);

System.out.println(doc);

//  Elements es = doc.body().getAllElements();

//  System.out.println(es.attr("onload"));

//  System.out.println(es.select("p"));

}

public void parseUrl() {

try {

//   Document doc = Jsoup.connect("http://……/").get();

String doc_web="http://www.…….cn";

Document doc = Jsoup.connect("http://www.…….cn/download/do_list.jsp?TYPE=1").get();

//   String title = doc.title();

Elements hrefs = doc.select("a[href~=www]");

//   for(Element href : hrefs){

//    op.saveUrl(href.toString());

//   }

//   String doc_link = hrefs.attr("href");

//   String doc_name = hrefs.text();

for (Element href : hrefs){

String doc_link = doc_web+href.attr("href");

String doc_name = href.text();

System.out.println(" address="+doc_link+" "+" name="+doc_name);

op.saveUrl(doc_name,doc_link,doc_web);

}

//   System.out.println(doc_name);

//   System.out.println("------------------");

//   System.out.println(hrefs.select("[href^=http]"));

//   System.out.println(title);

} catch (IOException e) {

e.printStackTrace();

}

}

public void parseFile() {

try {

File input = new File("d:\\abc\\input.html");

Document doc = Jsoup.parse(input, "UTF-8");

// 提取出所有的编号

Elements codes = doc.body().select("td[title^=IA] > a[href^=javascript:view]");

System.out.println(codes);

System.out.println("------------------");

System.out.println(codes.html());

} catch (IOException e) {

e.printStackTrace();

}

}

}

程序二

import java.io.File;

import java.io.IOException;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

public class testpage {

private crawldata op;

public testpage(){

this.op = new crawldata();

}

public static void main(String[] args) {

crawltest1 t = new crawltest1();

t.parseUrl();

}

public void parseUrl() {

try {

//   Document doc = Jsoup.connect("http://www…….cn/fagui/").get();

//   String doc_web="http://www.…….cn";

Document doc = Jsoup.connect("http://www.……cn/download/do_list.jsp?TYPE=1").get();

//   String title = doc.title();

//   Elements hrefs = doc.select("a[href~=www]");

Elements href2 = doc.select(":containsOwn(尾页)");

//   for(Element href : hrefs){

//    op.saveUrl(href.toString());

//   }

//   String doc_link = hrefs.attr("href");

//   String doc_name = hrefs.text();

//   for (Element href : hrefs){

//   String doc_link = doc_web+href.attr("href");

//   String doc_name = href.text();

//   System.out.println(" address="+doc_link+" "+" name="+doc_name);

//   op.saveUrl(doc_name,doc_link,doc_web);

//   }

System.out.println(href2.toString());

//   System.out.println(doc_name);

//   System.out.println("------------------");

//   System.out.println(hrefs.select("[href^=http]"));

//   System.out.println(title);

} catch (IOException e) {

e.printStackTrace();

}

}

}

程序三:

import java.sql.DriverManager;   import java.sql.Connection;   import java.sql.Statement;   import java.sql.ResultSet;   import java.sql.SQLException;      public class crawldata {       public static Connection getConnection() throws Exception {       String driver = "com.mysql.jdbc.Driver";       String url = "jdbc:mysql://localhost/test1";       String username = "root";       String password = "********";       Class.forName(driver);       Connection conn = DriverManager.getConnection(url, username, password);       return conn;     }       public void saveUrl(String name,String url,String web) {       Connection conn = null;       Statement stmt = null;       ResultSet rs = null;       try {         conn = getConnection();       String sql = "INSERT INTO docfirst(docname,docaddress,docweb) VALUES('"+name+"','"+url+"','"+web+"')";       stmt = conn.createStatement();            stmt.execute(sql);       //      rs = stmt.executeQuery("SELECT * FROM docfirst");   //      while (rs.next()) {   //        Integer id = rs.getInt("id");   //        String address = rs.getString("docaddress");   //        System.out.println("id=" + id + "  address=" + address);   //      }         }  catch (SQLException ex) {         System.err.println("SQLException: " + ex.getMessage());         System.err.println("SQLState: " + ex.getSQLState());         System.err.println("Message: " + ex.getMessage());         System.err.println("Vendor error code: " + ex.getErrorCode());       } catch (Exception e) {         System.err.println("Exception: " + e.getMessage());       } finally {         try {           rs.close();           stmt.close();           conn.close();         } catch (Exception ignore) {         }       }     }   }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值