HTML资料的100%提取

package jing.reg;

/**
* 字符串匹配100%提取

*/
import java.util.*;
import java.io.*;
import java.net.URLConnection;
import java.net.URL;

public class Stringindexof {
    public Stringindexof() {
    }

    public static void main(String[] args) throws Exception {
        //读取网URL上的文件 运得时注意思url是不能正常打开
        URL url = new URL("http://www.08866.com/phrase_shortshow.asp?smallname=玉女心经&smallid=5&maxpage=200");
        URLConnection urlconn = url.openConnection();
        BufferedReader in = new BufferedReader(new InputStreamReader(urlconn.
                getInputStream(), "GB2312"));
        String subline = null;
        String lineall = null;
        while ((subline = in.readLine()) != null) {
            lineall = lineall + subline;
        }
        in.close();

        PrintWriter fileout = new PrintWriter(new FileOutputStream("玉女心经.txt"));
//提取title=" "格式的中的文字
        subline = lineall;
        int i = 0;
        while (true) {
            lineall = subline;
            int star = lineall.indexOf("title=");
            if (star < 0) {
                break;
            }
            int end = lineall.indexOf("class", star);
            if (end > star) {
                i = i + 1;
                //System.out.println(lineall.substring(star, end));
                fileout.println(lineall.substring(star, end));
                subline = lineall.substring(end + 5);
            } else {
                subline = lineall.substring(star + 6);
            }
        }
        fileout.close();
        System.out.println(i + "行数据");
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值