基于Hashset 对中文词快速查询

该博客介绍了一个Java程序,用于读取包含10万个词的‘百度分词词库’文件并将其存储在内存中。程序通过创建HashSet实现单词索引,允许用户输入单词进行查找,如果单词存在于词库中则返回‘存在’,否则返回‘不存在’。程序实现了字符缓存输入流读取文件,并确保文件正确关闭。
摘要由CSDN通过智能技术生成

下载附件"百度分词词库", 里面大约有10w个词, 使用C语言或者Java实现单词快速查找功能(不借助第三方类库工具或者数据库), 将单词载入内存中, 建立词索引, 实现快速查找单词是否存在. 最终表现的功能是输入一个词, 返回这个词是否存在. 

主类query

将文件读入到hashset/内存中

字符缓存输入流 读取文件将文件内容放到set中

然后关闭文件流

public class TestQuery {
    public static void main(String[] args) {
        while(true) {
            System.out.println("请输入汉字,输入#表结束");
            Scanner scanner=new Scanner(System.in);
            String word=scanner.next();


            if(word.equals("#")){
                System.out.println("再见 欢迎你下次使用");
                break;

            }else {
                int flag=0;
                query query = new query();
                Set<String> words= query.readWordFile();
                for (String word1:words){
                    if (word1.equals(word)){
                        flag=1;break;
                    }
                }
                if (flag==1){
                    System.out.println("存在");
                }else{
                    System.out.println("不存在");
                }
            }

        }

    }
}

public class query {
    public Set<String> readWordFile() {
        Set<String> wordSet = null;

// 要读取的文件路径
        File file = new File(
                "index/src/Test/百度分词词库.txt");
        try {
// 读取文件输入流
            InputStreamReader read = new InputStreamReader(new FileInputStream(file), "utf-8");
// 文件是否是文件 和 是否存在
            if (file.isFile() && file.exists()) {

                wordSet = new HashSet<String>();
//字符缓存输入流
                BufferedReader br = new BufferedReader(read);
                String txt = null;


// 读取文件,将文件内容放入到set中
                while ((txt = br.readLine()) != null) {
                    wordSet.add(txt);
                }
                br.close();

            }


// 关闭文件流
            read.close();


        } catch (Exception e) {
            e.printStackTrace();
        }


        return wordSet;
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诉衷情の麻雀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值