拆分出一个数组中的连续数字

//拆分一个数组中连续的数字,可以参考字符串匹配算法
class Dispart
{
    int cnt=0;        //用于判断连续时用
    int index= 0;
    int[]st;
    Dispart(int len){    st = new int[2*len];    }    //分配所需要拆开的数组空间的2倍,防止空间不足
    void Disp(int a[])
    {
        int j=0,i;
         lab:
        for ( i=0;i< a.length; i+=cnt)
        {
            j = i;
            cnt = 0;
            while(true)
            {
                if (j==a.length)
                    break lab;
                if (a[i]+cnt==a[j])        //如果相等  例如:a[i]=1  a[j]=1   那么j++ a[j]=2 cnt++ ,cnt=1
                {                        //        a[i]+cnt==a[j]继续,否则偏移cnt个
                    
                    st[index] = a[j];
                    cnt++;
                    j++;
                    index++;
                }
                else{
                    st[index++] = -1;        //-1用于分隔用
                    break;
                }
            }
        }
        i=0;
        while(st[i]!=0)
        {
            if (st[i]==-1)
            {
                System.out.println();
            }
            else
                System.out.print(st[i]);
            i++;
        }
        
    }
    
}
class DispartDemo
{
    public static void main(String []args)
    {
    //    Array a = new Array[10];
        int []a = {1,2,4,5,7,8,9};
        Dispart d = new Dispart(a.length);
        d.Disp(a);   
    }
}



统计一行文本中单词个数数组通常是指将一段连续的文字拆分成单个单词,并计算每个单词现的次数,然后形成一个数组形式的结果。这个过程涉及到自然语言处理(NLP)中的基本步骤,包括分词、去除标点符号和停用词等。 以下是一个简单的步骤概述: 1. **文本预处理**:将字符串转换为小写,以便不区分大小写;去除多余的空白字符(如换行符或制表符)。 2. **分词**:根据语言规则(例如英文空格分隔或使用正则表达式),将文本分割成单词列表。 3. **清理词汇**:移除标点符号、数字和其他非字母字符,可能还需要排除一些常见的停用词(如“的”、“是”等在大多数上下文中没有太多含义的词语)。 4. **计数**:遍历单词列表,使用哈希表(Python中的`collections.Counter`或字典)存储每个单词及其现次数。 5. **数组表示**:最后,将统计结果转化为数组形式,元素为单词,值为对应的频率。 以下是一个简单的Python示例: ```python import re from collections import Counter def count_words(text): # 去除标点符号和转换为小写 text = re.sub(r'[^\w\s]', '', text.lower()) # 分词并计数 words = text.split() word_counts = Counter(words) # 返回单词计数组 return list(word_counts.items()) # 示例用法 text = "这是一段示例文本,包含多个单词,重复的单词会被计数。" word_array = count_words(text) print(word_array) # 输:[('这', 1), ('是', 1), ('一段', 1), ('示例', 1), ('文本', 1), ...] ``` 如果你想要获取的是每个单词现次数的数组,而不是元组对(单词, 现次数),可以稍作调整,仅保留计数值部分: ```python word_counts_array = [count for word, count in word_counts] ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值