java逆向最大匹配法_Java实现逆向最大匹配中文分词算法

根据原理自己实现的,实现方式可能不是很好,也没考虑资源浪费问题,单纯的实现了该算法

1.[代码][Java]代码

//Java实现逆向最大匹配中文分词算法

public class SplitChineseCharacter {

public static void main(String[] args) {

String input = "太好了,今天是星期六啊"; // 要匹配的字符串

new Split(input).start();

}

}

class Split {

private String[] dictionary = {"今天","是","星期","星期六"}; //词典

private String input = null;

public Split(String input) {

this.input = input;

}

public void start() {

String temp = null;

for(int i=0;i

temp = this.input.substring(i); // 每次从字符串的首部截取一个字,并存到temp中

//System.out.println("*****" + temp + "*********" + this.input);

// 如果该词在字典中, 则删除该词并在原始字符串中截取该词

if(this.isInDictionary(temp)) {

System.out.println(temp);

this.input = this.input.replace(temp, "");

i = -1; // i=-1是因为要重新查找, 而要先执行循环中的i++

}

}

// 当前循环完毕,词的末尾截去一个字,继续循环, 直到词变为空

if(null != this.input && !"".equals(this.input)) {

this.input = this.input.substring(0,this.input.length()-1);

this.start();

}

}

//判断当前词是否在字典中

public boolean isInDictionary(String temp) {

for(int i=0;i

if(temp.equals(this.dictionary[i])) {

return true;

}

}

return false;

}

}

/**

过程分析:

第一词循环:

太好了,今天是星期六啊

好了,今天是星期六啊

了,今天是星期六啊

,今天是星期六啊

今天是星期六啊

天是星期六啊

是星期六啊

星期六啊

期六啊

六啊

第一次循环没有找到,则从“太好了,今天是星期六啊”中把最后一个截取,开始第二次循环

第二次循环:

太好了,今天是星期六

好了,今天是星期六

了,今天是星期六

,今天是星期六

今天是星期六

天是星期六

是星期六

星期六 --------->输出:星期六,并在原字符串中截去“星期六”-->变为“太好了,今天是”

太好了,今天是

好了,今天是

了,今天是

,今天是

今天是

天是

是 ----------> 输出:是, 并在原字符串中截去“是”-->变为“太好了,今天”

.

.

.

直到原字符串变为空。

*/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值