使用编辑距离实现英语单词纠错-面向过程实现

任务:

使用编辑距离实现英语单词纠错。
实现:
1、先面向过程实现即可

面向过程实现

准备工作:
1、准备一个英语词典

实现过程:
1、初始化/构造:将词典加载到set中 (N)
2、将用户的英语句子分割成单词存入数组中,对数组中每个单词进行纠错 (M)
3、将取出的单词和set中的词典单词逐个比较,纠错:(M)
1)在的话,跳过
2)不在,就使用编辑距离纠错:
a.将当前错误单词和词典里的单词逐个计算编辑距离 N*(PlogP)
b.将编辑距离最小的输出/替换
ps:有可能有多个相同的编辑距离的候选单词,取其中一个即可。

时间复杂度:MN(PlogP)

分词-算法/方法:
根据空格/标点,将所有单词拆开


```package dao;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Scanner;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.junit.internal.runners.model.EachTestNotifier;

import sun.print.resources.serviceui;

public class EnglishWordCorrector {
   
	public static void main(String[] args) {
   
		String path = "C://Users//admin//Desktop//Spell.txt";//文件路径
		//1 英语词典的遍历
		Set<String> dict = readWordFile();
        //2 英语文章的遍历
		List<String> englishList = getEnglishCharacter(path);
        //3 英语文章的修改   	
		int i=0;
		String regex = "^[a-zA-Z]+$";
        for(String str : englishList){
      
        	if(str.matches(regex)){
   
        		if(!dict.contains(str)){
   
        			englishList.set(i, getCorrectWord(str));
        		}
        	}
    		i++;
        }
        int next_count = 0;
        for(String str:englishList){
   
        	next_count++
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值