C++后缀数组详解

C++后缀数组详解

嗯,后缀数组非常难讲,我对自己一点信心都没有TuT,各位神犇们如果有什么问题的话请评论教导蒟蒻。

后缀数组的优点:
每次基数排序的时间复杂度为O(n),排序的次数决定于最长公共子串的长度,最坏情况下,排序次数为logn次,所以总的时间复杂度为O(nlogn)。

基数排序:
要讲后缀数组的话先要提一下基数排序,基数排序其实就是将一个有第一关键字和第二关键字的单位进行排序,先按第二关键字再按第一关键字排序。

后缀的定义:
大家都知道子串什么意思吧,后缀是指从某个位置i开始到整个串末尾结束的一个特殊子串,比如说字符串abcd,bc就是他的其中一个子串,bcd就是他的其中一个后缀。

后缀数组的实现:
先定义几个数组:
sa[i]=j:排第i的是原字符串中(假设他是s[])s[j]为开头的后缀
rank[i]=j:在原字符串中s[i]排第j
y[i]=j:因为后面要补0(跟sa数组的记录方式一样,都是记录开头)
wr[i]=j:对第二关键字排序后的rank值
Rsort[i]=j:基数排序中要用到的数组,表示数字i出现了j次

基数排序构建后缀数组过程如下:
这里写图片描述

我们用图片所示的数据来讲:
第一趟:
1 2 4 1 1 1 2 3
这里的sa很好排,关键是后面怎么排

第二趟数据太简单懒得举

第三趟:
1,4 2,1 4,1 1,1 1,2 1,3 2,0 3,0
先第一关键字出现的次数(即Rsort数组):
Rsort[]={0,4,2,1,1}
现在我们将每一个次数加上前一个数字的次数,即Rsort[i]+=Rsort[i-1]
那么这个数组就变成了这样:
Rsort[]={0,4,6,7,8}
至于为什么要这样做呢,先放着,待会儿讲

然后我们根据第二关键字(就是第二个数字)排序,那怎么排呢,就要用到上一步搞好的Rsort
先从第二关键字最大的的1,4开始
他在原数组的位置是1,我们暂且记为sa[]=1
那么我们看看他的第一关键字的Rsort[1]=4,
那么我们就可以知道小于这个关键字的数有四个,那么我们可以直接毅然决然的sa[4]=1
为什么?刚讲了啊。别打我
之后我们要将Rsort[1]- -,以免影响到后面的判断
注意整个过程的i是从n到1的

那么第三趟走完的sa数组就是这样的:
sa[4]=1,sa[3]=6,sa[2]=5,sa[1]=4,sa[8]=3,sa[6]=2,sa[7]=8,sa[5]=7

还有几点
1、y数组的处理,因为末尾补0,那么就要减去当前子串的长度,可以理解为压缩后的原数组,因为第二关键字是0的肯定会排在前面所以我们不需要去理他。
2、m的定义,m表示的是字符串中每一个字符的最大大小,一般为128

那么下面贴代码,你们结合代码理解一下吧

后缀数组的实现:
这里推荐一道后缀数组的模板题,bzoj1031我写了博客
http://blog.csdn.net/cabi_zgx/article/details/53464766

bool cmp(int k1,int k2,int ln)//判断两个字符串是否相等 
{
    return wr[k1]==wr[k2] && wr[k1+ln]==wr[k2+ln];
}
void get_sa(int m) //构建SA后缀数组
{
    int i,k,p,ln;
    for(int i=1;i<=n;i++) rank[i]=a[i]; 
    //a数组:原字符串,rank名次数组
    for(i=0;i<=m;i++) Rsort[i]=0; 
    for(i=1;i<=n;i++) Rsort[rank[i]]++;
    for(i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
    for(i=n;i>=1;i--) sa[Rsort[rank[i]]--]=i;  
    //以上四句为基数排序,不懂的看flash
    ln=1;p=0; 
    // ln为当前子串的长度,p表示有多少不相同的子串
    while(p<n)
    {
        for(k=0,i=n-ln+1;i<=n;i++) y[++k]=i;
        for(i=1;i<=n;i++) if (sa[i]-ln>0) y[++k]=sa[i]-ln;
        for(i=1;i<=n;i++) wr[i]=rank[y[i]];
        //数组y保存的是对第二关键字排序的结果 。
        //数组wr保存的是对第二关键字排序后的rank值
        //以下为对第一关键字排序
        for(i=0;i<=m;i++) Rsort[i]=0;
        for(i=1;i<=n;i++) Rsort[wr[i]]++;
        for(i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
        for(i=n;i>=1;i--) sa[Rsort[wr[i]]--]=y[i];
        for(i=1;i<=n;i++) wr[i]=rank[i];   
        p=1; rank[sa[1]]=1;
        for(i=2;i<=n;i++)
        {
            if(!cmp(sa[i],sa[i-1],ln)) p++;
            rank[sa[i]]=p;
        }
        //得到新的rank数组
        m=p;ln*=2;
    }
    a[0]=0;sa[0]=0;
}

终于写完了,蒟蒻泪奔中~~

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我会尽力回答您的问题。对于您的问题,我建议您采用以下的程序实现: 1. 设计一个课程信息的结构体,包含学期、专业班级、时间、科目、教室等基本信息。 2. 设计一个课程信息的文件存储方式,可以自定义文件后缀名,以便查找和管理。 3. 设计主菜单,包含添加、删除、修改、查询和排序等功能选项。 4. 添加功能:输入课程信息,将课程信息添加到文件中。 5. 删除功能:输入要删除的课程信息,从文件中删除该课程信息。 6. 修改功能:输入要修改的课程信息,修改该课程信息,并将修改后的信息重新写入文件。 7. 查询功能:输入班级、时间等信息,按照给定条件查询并显示相关信息。 8. 排序功能:按照学期或班级信息对课表进行排序,并存入文件中。 9. 扩展功能:根据需要可添加权限处理、模糊查询、综合查询、统计功能等。 下面是一个简单的示例代码,可能需要根据实际情况进行修改和完善: ```c++ #include <iostream> #include <fstream> #include <string> #include <vector> #include <algorithm> using namespace std; // 课程信息结构体 struct Course { string term; string majorClass; string time; string subject; string classroom; }; // 文件后缀名 const string FILE_EXTENSION = ".kcb"; // 文件路径 string filePath; // 读取课程信息文件 vector<Course> loadCourses() { vector<Course> courses; ifstream inFile(filePath); if (inFile) { Course course; while (inFile >> course.term >> course.majorClass >> course.time >> course.subject >> course.classroom) { courses.push_back(course); } } inFile.close(); return courses; } // 保存课程信息文件 void saveCourses(vector<Course> courses) { ofstream outFile(filePath); if (outFile) { for (Course course : courses) { outFile << course.term << " " << course.majorClass << " " << course.time << " " << course.subject << " " << course.classroom << endl; } } outFile.close(); } // 添加课程信息 void addCourse() { Course course; cout << "请输入学期:" << endl; cin >> course.term; cout << "请输入专业班级:" << endl; cin >> course.majorClass; cout << "请输入上课时间:" << endl; cin >> course.time; cout << "请输入科目:" << endl; cin >> course.subject; cout << "请输入教室:" << endl; cin >> course.classroom; vector<Course> courses = loadCourses(); courses.push_back(course); saveCourses(courses); cout << "添加成功!" << endl; } // 删除课程信息 void deleteCourse() { Course course; cout << "请输入要删除的课程信息:" << endl; cout << "学期 班级 上课时间 科目 教室" << endl; cin >> course.term >> course.majorClass >> course.time >> course.subject >> course.classroom; vector<Course> courses = loadCourses(); vector<Course>::iterator iter = find(courses.begin(), courses.end(), course); if (iter != courses.end()) { courses.erase(iter); saveCourses(courses); cout << "删除成功!" << endl; } else { cout << "没有找到要删除的课程信息!" << endl; } } // 修改课程信息 void modifyCourse() { Course course; cout << "请输入要修改的课程信息:" << endl; cout << "学期 班级 上课时间 科目 教室" << endl; cin >> course.term >> course.majorClass >> course.time >> course.subject >> course.classroom; vector<Course> courses = loadCourses(); vector<Course>::iterator iter = find(courses.begin(), courses.end(), course); if (iter != courses.end()) { cout << "请输入修改后的课程信息:" << endl; cout << "学期 班级 上课时间 科目 教室" << endl; cin >> iter->term >> iter->majorClass >> iter->time >> iter->subject >> iter->classroom; saveCourses(courses); cout << "修改成功!" << endl; } else { cout << "没有找到要修改的课程信息!" << endl; } } // 查询课程信息 void queryCourse() { string majorClass; string time; cout << "请输入查询条件:" << endl; cout << "专业班级(全部则输入ALL):" << endl; cin >> majorClass; cout << "上课时间(全部则输入ALL):" << endl; cin >> time; vector<Course> courses = loadCourses(); if (majorClass == "ALL" && time == "ALL") { for (Course course : courses) { cout << course.term << " " << course.majorClass << " " << course.time << " " << course.subject << " " << course.classroom << endl; } } else if (majorClass == "ALL") { for (Course course : courses) { if (course.time == time) { cout << course.term << " " << course.majorClass << " " << course.time << " " << course.subject << " " << course.classroom << endl; } } } else if (time == "ALL") { for (Course course : courses) { if (course.majorClass == majorClass) { cout << course.term << " " << course.majorClass << " " << course.time << " " << course.subject << " " << course.classroom << endl; } } } else { for (Course course : courses) { if (course.majorClass == majorClass && course.time == time) { cout << course.term << " " << course.majorClass << " " << course.time << " " << course.subject << " " << course.classroom << endl; } } } } // 排序课程信息 void sortCourse() { string option; cout << "请选择排序方式:" << endl; cout << "1. 按学期排序" << endl; cout << "2. 按专业班级排序" << endl; cin >> option; vector<Course> courses = loadCourses(); if (option == "1") { sort(courses.begin(), courses.end(), [](Course a, Course b) { return a.term < b.term; }); } else if (option == "2") { sort(courses.begin(), courses.end(), [](Course a, Course b) { return a.majorClass < b.majorClass; }); } saveCourses(courses); cout << "排序成功!" << endl; } int main() { cout << "欢迎使用课表查询系统!" << endl; cout << "请输入课程信息文件路径(包含文件名和后缀名):" << endl; cin >> filePath; while (true) { cout << "请选择操作:" << endl; cout << "1. 添加课程信息" << endl; cout << "2. 删除课程信息" << endl; cout << "3. 修改课程信息" << endl; cout << "4. 查询课程信息" << endl; cout << "5. 排序课程信息" << endl; cout << "6. 退出系统" << endl; string option; cin >> option; if (option == "1") { addCourse(); } else if (option == "2") { deleteCourse(); } else if (option == "3") { modifyCourse(); } else if (option == "4") { queryCourse(); } else if (option == "5") { sortCourse(); } else if (option == "6") { break; } else { cout << "输入有误,请重新输入!" << endl; } } cout << "感谢使用课表查询系统!" << endl; return 0; } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值