Life Forms(后缀数组)

思路

就是用后缀数组加二分,这里要把每一个子串连成一个串,每一个串用一个不可能出现的字符,例如#,*之类的分开,然后对连城的字符串做后缀数组,再二分一下最长公共串长度就可以了。

代码(转载

#include<iostream>
#include<algorithm>
#include<stdio.h>
#include<string.h>
#include<vector>
using namespace std;
const int N=1000010;
int s[N];
int c[N],x[N],y[N],n,m,height[N],rk[N],sa[N];
void Suffix()
{
     for(int i=0;i<m;i++) c[i]=0;
     for(int i=0;i<n;i++) c[x[i]=s[i]]++;
     for(int i=1;i<m;i++) c[i]+=c[i-1];
     for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
     for(int k=1;k<=n;k<<=1)
     {
         int p=0;
         for(int i=n-k;i<n;i++) y[p++]=i;
         for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
 
         for(int i=0;i<m;i++) c[i]=0;
         for(int i=0;i<n;i++) c[x[y[i]]]++;
         for(int i=1;i<m;i++) c[i]+=c[i-1];
         for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
         swap(x,y);
         p=1;x[sa[0]]=0;
         for(int i=1;i<n;i++)
            x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
         if(p>=n) break;
         m=p;
     }
}
void getheight()
{
    for(int i=0;i<n;i++) rk[sa[i]]=i;
    for(int i=0,k=0;i<n;i++)
    {
        if(rk[i])
        {
            if(k) --k;
            //else k=0;
            int j=sa[rk[i]-1];
            while(s[i+k]==s[k+j]) k++;
            height[rk[i]]=k;
        }
    }
}
char str[4010];
int vis[N],mp[N];int t;//mp记录每一个子串的位置
int mar[N];
vector<int>ans[1010];
int check(int x)
{
    for(int i=1;i<n;i++)
    {
        if(height[i]<x) continue;
        int cnt=0;
        for(int j=0;j<=t;j++) vis[j]=0;
        while(height[i]>=x&&i<n)
        {
            if(!vis[mp[sa[i-1]]])//这里用vis记一下那些串被用过了,一方面防止一子串多次记录,一方
                                 //面防止在同一个串里匹配
            {
                vis[mp[sa[i-1]]]=1;
                cnt++;
            }
            i++;
        }
        if(!vis[mp[sa[i-1]]])
        {
                vis[mp[sa[i-1]]]=1;
                cnt++;
        }
        if(cnt>t/2)//最后我们还要看一下有没有符合要求
        {
            ans[x].push_back(sa[i-1]);
        }
    }
    if(ans[x].size()!=0) return 1;
    return 0;
}
 
int main()
{
    int scc=0;
    while(~scanf("%d",&t)&&t)
    {
        if(scc)cout<<endl;scc++;
        for(int i=0;i<=1000;i++)
            ans[i].clear();
        n=0;
        for(int i=0;i<t;i++)
        {
            scanf("%s",str);
            int l1=strlen(str);
            for(int j=0;j<l1;j++)
            {
                s[n++]=str[j]-'a'+1;
                mp[n-1]=i;
            }
            s[n++]='#'+i;
 
        }
        s[n++]=0;
        m=150;
        Suffix();
        getheight();
        int l=1,r=1000,mid,len=0;
        while(l<=r)
        {
            mid=(l+r)>>1;
            if(check(mid))
            {
                len=mid;
                l=mid+1;
            }
            else
                r=mid-1;
        }
        if(len==0) printf("?\n");
        else
        {
            for(int i=0;i<ans[len].size();i++)
            {
                for(int j=ans[len][i];j<ans[len][i]+len;j++)
                    printf("%c",s[j]+'a'-1);
                printf("\n");
            }
        }
    }
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 支持向量机非线性回归通用MATLAB程序解析 #### 一、概述 本文将详细介绍一个基于MATLAB的支持向量机(SVM)非线性回归的通用程序。该程序采用支持向量机方法来实现数据的非线性回归,并通过不同的核函数设置来适应不同类型的数据分布。此外,该程序还提供了数据预处理的方法,使得用户能够更加方便地应用此程序解决实际问题。 #### 二、核心功能与原理 ##### 1. 支持向量机(SVM) 支持向量机是一种监督学习模型,主要用于分类和回归分析。对于非线性回归任务,SVM通过引入核技巧(kernel trick)将原始低维空间中的非线性问题转换为高维空间中的线性问题,从而实现有效的非线性建模。 ##### 2. 核函数 核函数的选择直接影响到模型的性能。本程序内置了三种常用的核函数: - **线性核函数**:`K(x, y) = x'y` - **多项式核函数**:`K(x, y) = (x'y + 1)^d` - **径向基函数(RBF)**:`K(x, y) = exp(-γ|x - y|^2)` 其中RBF核函数被广泛应用于非线性问题中,因为它可以处理非常复杂的非线性关系。本程序默认使用的是RBF核函数,参数`D`用于控制高斯核函数的宽度。 ##### 3. 数据预处理 虽然程序本身没有直接涉及数据预处理的过程,但在实际应用中,对数据进行适当的预处理是非常重要的。常见的预处理步骤包括归一化、缺失值处理等。 ##### 4. 模型参数 - **Epsilon**: ε-insensitive loss function的ε值,控制回归带宽。 - **C**: 松弛变量的惩罚系数,控制模型复杂度与过拟合的风险之间的平衡。 #### 三、程序实现细节 ##### 1. 函数输入与输出 - **输入**: - `X`: 输入特征矩阵,维度为(n, l),其中n是特征数量,l是样本数量。 - `Y`: 目标值向量,长度为l。 - `Epsilon`: 回归带宽。 - `C`: 松弛变量的惩罚系数。 - `D`: RBF核函数的参数。 - **输出**: - `Alpha1`: 正的拉格朗日乘子向量。 - `Alpha2`: 负的拉格朗日乘子向量。 - `Alpha`: 拉格朗日乘子向量。 - `Flag`: 标记向量,表示每个样本的类型。 - `B`: 偏置项。 ##### 2. 核心代码解析 程序首先计算所有样本间的核矩阵`K`,然后构建二次规划问题并求解得到拉格朗日乘子向量。根据拉格朗日乘子的值确定支持向量,并计算偏置项`B`。 - **核矩阵计算**:采用RBF核函数,通过`exp(-(sum((xi-xj).^2)/D))`计算任意两个样本之间的相似度。 - **二次规划**:构建目标函数和约束条件,使用`quadprog`函数求解最小化问题。 - **支持向量识别**:根据拉格朗日乘子的大小判断每个样本是否为支持向量,并据此计算偏置项`B`。 #### 四、程序扩展与优化 - **多核函数支持**:可以通过增加更多的核函数选项,提高程序的灵活性。 - **自动调参**:实现参数自动选择的功能,例如通过交叉验证选择最优的`Epsilon`和`C`值。 - **并行计算**:利用MATLAB的并行计算工具箱加速计算过程,特别是当样本量很大时。 #### 五、应用场景 该程序适用于需要进行非线性回归预测的场景,如经济预测、天气预报等领域。通过调整核函数和参数,可以有效应对各种类型的非线性问题。 ### 总结 本程序提供了一个支持向量机非线性回归的完整实现框架,通过灵活的核函数设置和参数调整,能够有效地处理非线性问题。对于需要进行回归预测的应用场景,这是一个非常实用且强大的工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值