文本文件单词的检索与技术

文本文件单词的检索与技术

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.util.Scanner;

public class file {
    int line=0;//记录行数
    String str="";//存放文件读出的内容
    String word;//存放查找的单词
    int count;//记录单词出现的次数
    public void newFile() throws IOException {
        System.out.println("请输入文件地址:");
        Scanner scanner=new Scanner(System.in);
        String path =scanner.next();
        File file = new File(path);
        // read
        FileReader fr = new FileReader(file);
        BufferedReader br = new BufferedReader(fr);
        System.out.println("请输入要查询的单词:");
        word=scanner.next();
        char[]w=word.toCharArray();
        while((str=br.readLine())!=null) {
            line++;
            char[]st=str.toCharArray();
            if(KMP(st,w)==true) {   //查询单词位置,true表示该单词出现在这一行
                System.out.println("在第" + line + "行");
            }
        }
        br.close();
        fr.close();
        if(count>0) {
            System.out.println("该单词总共出现了" + count + "次");
        }else{
            System.out.println("该单词在文中不存在!");
        }


    }
    //str是待检测字符串,ptr是搜索的模式子串
    public boolean KMP(char[] str,char[] ptr){//KMP方法查找单词
        //计算模式子串的next数组
        int[] next=cal_next(ptr);
        boolean flag=false;
        int slen=str.length;
        int plen=ptr.length;//子串的长度
        int num=0;//存放查询单词位置
        int j=-1;
        for(int i=0;i<slen;i++){
            while(j>-1&&ptr[j+1]!=str[i]){
                j=next[j];
            }
            if(ptr[j+1]==str[i]){
                j=j+1;
            }
            if(Character.isSpaceChar(str[i])){
                num++;//遇空格单词数位置+1
            }
            //模式子串遍历到了最后,则说明匹配成功
            if(j==(plen-1)){
                j=0;
                count++;
                System.out.println("该单词第"+count+"次"+"出现的位置在第"+(num+1)+"个单词");//存在则输出位置
                flag= true;
            }
        }
        return flag;
    }
    public int[] cal_next(char[] s) {
        int len = s.length;
        int[] next = new int[len];
        next[0] = -1;
        int k = -1;//k表示s[0,k]字符串的最长前缀等于最长后缀时的最长前缀长度减去1
        //遍历长度为n的子串,时间复杂度O(n)
        for (int q = 1; q <= (len - 1); q++) {
            //如果下一个不同,那么k就变成next[k],注意next[k]是小于k的,无论k取任何值。
            while (k > -1 && s[k + 1] != s[q]) {
                k = next[k];//往前回溯
            }
            if (s[k + 1] == s[q]) {
                k = k + 1;
            }
            //这个是把算的k的值(就是相同的最大前缀或最大后缀的长度减去1)赋给next[q]
            next[q] = k;
        }
        return next;
    }
    public static void main(String[] args) throws IOException {
        file f=new file();
        f.newFile();
    }

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值