KWIC-C/C++实现

吐槽

最近我们 Java 老师不知道为啥非要我用 C/C++ 来实现 KWIC ,但是因为没有上过课,不知道这个东西是干嘛的,所以想网上 download 一下,然而,百度后发现,实在是没有什么能看的过眼的代码,修改他们的代码难度比自己写要大好多,于是,决定找一下定义自己动手实现一下。

描述

KWIC 索引系统接受一些行,每行有若干字,每个字由若干字符组成;每行都可以循环移位,亦即重复地把第一个字删除,然后接到行末; KWIC 把所有行的各种移位情况按照字母表顺序输出。

分析

上述关于 KWIC 的描述猛一看有些懵逼,因为并不知道这样做有啥子卵用,这种操作到底有啥存在的价值呢?为什么那么多软件设计课程要把他定为课堂讲义的经典呢?这些都不得而知了,为了让自己更好的理解,我找到了一个比较好的图解。

描述

看到这里的样例,我想应该很容易理解了,首先按照行来读取,每行由若干单词组成,然后将所有行所有的可能移位结果放在一起进行排序,最后输出即可。需求很简单,不过这里的排序我并没有搞清楚具体什么排序规则……于是我就简操作,略微偷个懒,直接按照所有移位结果的单词的字典序进行比较,不考虑空格,考虑大小写的区别。代码很简单,区区一百行足矣,实在是搞不懂网上的那些大佬们为毛子要用二三百行来实现……

代码

#include <iostream>
#include <cstring>
#include <vector>

using namespace std;

struct line
{
    vector<string> vs;
} L;

vector<line> vl;

struct words
{
    int vl_pos, vs_pos;
};

vector<words> vw;

bool cmp(const words &a, const words &b)
{
    line La, Lb;
    for (int i = a.vs_pos; i < vl[a.vl_pos].vs.size(); i++)
    {
        La.vs.push_back(vl[a.vl_pos].vs[i]);
    }
    for (int i = 0; i < a.vs_pos; i++)
    {
        La.vs.push_back(vl[a.vl_pos].vs[i]);
    }

    for (int i = b.vs_pos; i < vl[b.vl_pos].vs.size(); i++)
    {
        Lb.vs.push_back(vl[b.vl_pos].vs[i]);
    }
    for (int i = 0; i < b.vs_pos; i++)
    {
        Lb.vs.push_back(vl[b.vl_pos].vs[i]);
    }

    int len = min((int)La.vs.size(), (int)Lb.vs.size());
    for (int i = 0; i < len; i++)
    {
        if (La.vs[i] != Lb.vs[i])
        {
            return La.vs[i] < Lb.vs[i];
        }
    }

    return La.vs.size() < Lb.vs.size();
}

string word;

int main()
{
    while (cin >> word)
    {
        L.vs.push_back(word);
        if (getchar() == '\n')
        {
            vl.push_back(L);
            L.vs.clear();   //  此处可以优化
        }
    }

    for (int i = 0; i < vl.size(); i++)
    {
        for (int j = 0; j < vl[i].vs.size(); j++)
        {
            vw.push_back({i, j});
        }
    }

    sort(vw.begin(), vw.end(), cmp);

    for (int i = 0; i < vw.size(); i++)
    {
        int vl_pos = vw[i].vl_pos, vs_pos = vw[i].vs_pos;
        int vs_sz = (int)vl[vw[i].vl_pos].vs.size(), c = 0;
        for (int j = vs_pos; j < vs_sz; j++)
        {
            c++;
            cout << vl[vl_pos].vs[j] << (c == vs_sz ? '\n' : ' ');
        }
        for (int j = 0; j < vs_pos; j++)
        {
            c++;
            cout << vl[vl_pos].vs[j] << (c == vs_sz ? '\n' : ' ');
        }
    }

    return 0;
}

测试

按照上述图解里的样例进行测试,测试结果正确。

描述

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值