n_Gram 算法

n_gram:n阶马尔科夫链算法


package org;

import java.util.ArrayList;
import java.util.List;

/**
 * Created by Administrator on 2014/5/27.
 */
public class Gram_2 {

    public static List<String> ngrams(int n, String str) {
        List<String> ngrams = new ArrayList<String>();
        str = str.replaceAll("\\pP|\\pS"," ");
        String[] words = str.split("");
        for (int i = 0; i < words.length - n + 1; i++)
            ngrams.add(concat(words, i, i + n));
        return ngrams;
    }

    public static String concat(String[] words, int start, int end) {
        StringBuilder sb = new StringBuilder();
        for (int i = start; i < end; i++)
            sb.append((i > start ? "" : "") + words[i]);
        return sb.toString();
    }

    public static void main(String[] args) {
        for (int n = 1; n <= 10; n++) {
            List<String> resultList = ngrams(n, "居然是这样的... 四代秘闻,四代火影的死是个阴谋!当年到底发生了什么?");
            for (String ngram : resultList)
                System.out.println(ngram);
            System.out.println();
        }
    }
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值