数据结构课程设计-单词检查

问题 I: 单词检查(Ⅰ)- 顺序表实现
时间限制: 1 Sec  内存限制: 128 MB
提交: 2227  解决: 736
[提交][状态][讨论版]
题目描述
许多应用程序,如字处理软件,邮件客户端等,都包含了单词检查特性。单词检查是根据字典,找出输入文本中拼错的单词,我们认为凡是不出现在字典中的单词都是错误单词。不仅如此,一些检查程序还能给出类似拼错单词的修改建议单词。 例如字典由下面几个单词组成:
 bake cake main rain vase
如果输入文件中有词vake ,检查程序就能发现其是一个错误的单词,并且给出 bake, cake或vase做为修改建议单词。
修改建议单词可以采用如下生成技术:
 (1)在每一个可能位置插入‘a-'z'中的一者
 (2)删除单词中的一个字符
 (3)用‘a'-'z'中的一者取代单词中的任一字符
   很明显拼写检查程序的核心操作是在字典中查找某个单词,如果字典很大,性能无疑是非常关键的。
   你写的程序要求读入字典文件,然后对一个输入文件的单词进行检查,列出其中的错误单词并给出修改建议。

课程设计必须采用如下技术完成并进行复杂度分析及性能比较。
(1)朴素的算法,用线性表维护字典
(2)使用二叉排序树维护字典
(3)采用hash技术维护字典

本题要求使用顺序表实现。

输入
输入分为两部分。
第一部分是字典,每个单词占据一行,最后以仅包含'#'的一行表示结束。所有的单词都是不同的,字典中最多10000个单词。

输入的第二部分包含了所有待检测的单词,单词数目不超过50。每个单词占据一行,最后以仅包含'#'的一行表示结束。

字典中的单词和待检测的单词均由小写字母组成,并且单词最大长度为15。
输出
按照检查次序每个单词输出一行,该行首先输出单词自身。如果单词在字典中出现,接着输出" is correct"。如果单词是错误的,那么接着输出':',如果字典中有建议修改单词,则按照字典中出现的先后次序输出所有的建议修改单词(每个前面都添加一个空格),如果无建议修改单词,在':'后直接换行。
样例输入
i
is
has
have
be
my
more
contest
me
too
if
award
#
me
aware
m
contest
hav
oo
or
i
fi
mre
#
样例输出
me is correct
aware: award
m: i my me
contest is correct
hav: has have
oo: too
or:
i is correct
fi: i
mre: more me

单词检查I,数据量不大,直接暴力就行。

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+5;
struct node
{
    char a[200];
    int len;
}t[maxn];
char a[20];
int main()
{
    int len=0;
    while(scanf("%s",t[len].a)==1&&t[len].a[0]!='#')
    {
        int k=0;
        long long ans=0;
        for(int i=0;t[len].a[i]!='\0';i++) k++;
        t[len].len=k;
        len++;
    }
    while(scanf("%s",a)==1&&a[0]!='#')
    {
        printf("%s",a);
        int n=strlen(a);
        int f=0;
        for(int i=0;i<len;i++)
        {
            if(t[i].len==n)
            {
                int b=0;
                for(int j=0;j<n;j++)
                {
                    if(a[j]!=t[i].a[j]) break;
                    else b++;
                }
                if(b==n)
                {
                    f=1;
                    break;
                }
            }
        }
        if(f==1)
        {
            printf(" is correct\n");
            continue;
        }
        printf(":");
        for(int i=0;i<len;i++)
        {
            if(t[i].len-n==1||n-t[i].len==1||t[i].len==n)
            {
                int h=0,flag=0;
                int p1=0,k1=0;
                while(p1<n&&k1<t[i].len)
                {
                    if(a[p1]==t[i].a[k1]) p1++,k1++,h++;
                    else if(t[i].len-n==1) k1++;
                    else if(n-t[i].len==1) p1++;
                    else p1++,k1++;
                }
                if(t[i].len-n==1)
                {
                    if(h==n) flag=1;
                }
                else if(n-t[i].len==1)
                {
                    if(h==t[i].len) flag=1;
                }
                else
                {
                    if(h==(n-1)) flag=1;
                }
                if(flag) printf(" %s",t[i].a);
            }
        }
        printf("\n");
    }
}

问题 J: 单词检查(Ⅱ)- 二叉排序树实现
时间限制: 2 Sec  内存限制: 128 MB
提交: 322  解决: 107
[提交][状态][讨论版]
题目描述
许多应用程序,如字处理软件,邮件客户端等,都包含了单词检查特性。单词检查是根据字典,找出输入文本中拼错的单词,我们认为凡是不出现在字典中的单词都是错误单词。不仅如此,一些检查程序还能给出类似拼错单词的修改建议单词。 例如字典由下面几个单词组成:
 bake cake main rain vase
如果输入文件中有词vake ,检查程序就能发现其是一个错误的单词,并且给出 bake, cake或vase做为修改建议单词。
修改建议单词可以采用如下生成技术:
 (1)在每一个可能位置插入‘a-'z'中的一者
 (2)删除单词中的一个字符
 (3)用‘a'-'z'中的一者取代单词中的任一字符
很明显拼写检查程序的核心操作是在字典中查找某个单词,如果字典很大,性能无疑是非常关键的。
你写的程序要求读入字典文件,然后对一个输入文件的单词进行检查,列出其中的错误单词并给出修改建议。

本题要求使用使用二叉排序树维护字典。为了防止有些人取巧,本题要求输出相应的二叉排序树后序遍历。

输入
输入分为两部分。
第一部分是字典,每个单词占据一行,最后以仅包含'#'的一行表示结束。所有的单词都是不同的,字典中最多10000个单词。

输入的第二部分包含了所有待检测的单词,单词数目不超过50。每个单词占据一行,最后以仅包含'#'的一行表示结束。

字典中的单词和待检测的单词均由小写字母组成,并且单词最大长度为15。
输出
第一行输出二叉排序树字典的后序遍历,每一个单词后面跟一个空格。
然后按照检查次序每个单词输出一行,该行首先输出单词自身。如果单词在字典中出现,接着输出" is correct"。如果单词是错误的,那么接着输出':',如果字典中有建议修改单词,则按照字典中出现的先后次序输出所有的建议修改单词(每个前面都添加一个空格),如果无建议修改单词,在':'后直接换行。

样例输入
i
is
has
have
be
my
more
contest
me
too
if
award
#
me
aware
m
contest
hav
oo
or
i
fi
mre
#
样例输出
award contest be have has if me more too my is i 
me is correct
aware: award
m: i my me
contest is correct
hav: has have
oo: too
or:
i is correct
fi: i
mre: more me

单词检查II,用string会方便不少,树结点的结构也需要有所变化,因为输出要求的是字典的输入先后次序!

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5;
typedef struct node
{
    string data;
    int d;
    struct node *lc;
    struct node *rc;
} node,*link;
int a[maxn];
string e,key;
int dex,cnt,dd;
int n;
struct nod
{
    string ss;
}t[maxn];
void Insert(link &root,int dex)
{
    if(!root)
    {
        link s=new node;
        s->data=e;
        s->d=dex;
        s->lc=s->rc=NULL;
        root=s;
    }
    else if(e<root->data) Insert(root->lc,dex);
    else if(e>root->data) Insert(root->rc,dex);
}
void creat(link &root)
{
    cin>>e;
    cnt=0;
    while(e[0]!='#')
    {
        t[cnt].ss=e;
        Insert(root,cnt);
        cnt++;
        cin>>e;
    }
}
void display(link root)
{
    if(root)
    {
        display(root->lc);
        display(root->rc);
        cout<<root->data<<' ';
    }
}
link Find(link root)
{
    if(!root||key==root->data) return root;
    else if(key<root->data) Find(root->lc);
    else Find(root->rc);
}
void Search(link root)
{
    if(root)
    {
        int len=(root->data).size();
        int h=0,flag=0;
        int p1=0,k1=0;
        if(n-len==1||len-n==1||len==n)
        {
            while(p1<n&&k1<len)
            {
                if(key[p1]==root->data[k1]) p1++,k1++,h++;
                else if(len-n==1) k1++;
                else if(n-len==1) p1++;
                else p1++,k1++;
            }
            if(len-n==1)
            {
                if(h==n) flag=1;
            }
            else if(n-len==1)
            {
                if(h==len) flag=1;
            }
            else
            {
                if(h==(n-1)) flag=1;
            }
            if(flag) a[dd++]=root->d;
        }
        Search(root->lc);
        Search(root->rc);
    }
}
int main()
{
    link root;
    root=NULL;
    creat(root);
    display(root);
    cout<<"\n";
    while(cin>>key&&key[0]!='#')
    {
        cout<<key;
        int flag=0;
        if(Find(root)!=NULL)
        {
            cout<<" is correct"<<endl;
            continue;
        }
        cout<<':';
        n=key.size();
        dd=0;
        Search(root);
        sort(a,a+dd);
        for(int i=0;i<dd;i++) cout<<' '<<t[a[i]].ss;
        cout<<"\n";
    }
}

问题 K: 单词检查(Ⅲ)- Hash表实现
时间限制: 1 Sec  内存限制: 128 MB
提交: 201  解决: 24
[提交][状态][讨论版]
题目描述
许多应用程序,如字处理软件,邮件客户端等,都包含了单词检查特性。单词检查是根据字典,找出输入文本中拼错的单词,我们认为凡是不出现在字典中的单词都是错误单词。不仅如此,一些检查程序还能给出类似拼错单词的修改建议单词。 例如字典由下面几个单词组成:
 bake cake main rain vase
如果输入文件中有词vake ,检查程序就能发现其是一个错误的单词,并且给出 bake, cake或vase做为修改建议单词。

修改建议单词可以采用如下生成技术:

 (1)在每一个可能位置插入‘a-'z'中的一者
 (2)删除单词中的一个字符
 (3)用‘a'-'z'中的一者取代单词中的任一字符
   很明显拼写检查程序的核心操作是在字典中查找某个单词,如果字典很大,性能无疑是非常关键的。
你写的程序要求读入字典文件,然后对一个输入文件的单词进行检查,列出其中的错误单词并给出修改建议。

本题要求采用hash技术维护字典,hash的实现必须由同学们编码完成,不能采用C++或JAVA的泛型库。
hash函数建议自行设计一个,然后和成熟的hash函数比较,比如下面的ELF hash函数。
/* UNIX ELF hash
 * Published hash algorithm used in the UNIX ELF format for object files
 */
unsigned long hash(char *name)
{
unsigned long h = 0, g;

while ( *name ) {
h = ( h << 4 ) + *name++;
if ( g = h & 0xF0000000 )
h ^= g >> 24;
h &= ~g;
}
return h;
}
另外,请比较线性地址法和链地址法两种冲突处理方法的性能,以及调整hash表大小对性能的影响。
输入
输入分为两部分。
第一部分是字典,每个单词占据一行,最后以仅包含'#'的一行表示结束。所有的单词都是不同的,字典中最多500000个单词。

输入的第二部分包含了所有待检测的单词,单词数目不超过200。每个单词占据一行,最后以仅包含'#'的一行表示结束。

字典中的单词和待检测的单词均由小写字母组成,并且单词最大长度为15。
输出
按照检查次序每个单词输出一行,该行首先输出单词自身。如果单词在字典中出现,接着输出" is correct"。如果单词是错误的,那么接着输出':',如果字典中有建议修改单词,则按照字典中出现的先后次序输出所有的建议修改单词(每个前面都添加一个空格),如果无建议修改单词,在':'后直接换行。
样例输入
i
is
has
have
be
my
more
contest
me
too
if
award
#
me
aware
m
contest
hav
oo
or
i
fi
mre
#
样例输出
me is correct
aware: award
m: i my me
contest is correct
hav: has have
oo: too
or:
i is correct
fi: i
mre: more me

去年这题的数据量是10000,今年改成了500000,时间卡得很紧,TLE很多次,MLE也不少,考虑问题的时候,对于复杂度的分析真的非常关键,学会转化思考问题的角度,换一种视角,问题便能迎刃而解……

此题的正确解法是:枚举所有的建议单词,在以该单词的哈希值为索引的邻接表中查找即可!!!

#include<bits/stdc++.h>
using namespace std;
char ww[27]="abcdefghijklmnopqrstuvwxyz";
const int maxn=5e5+1;
int key[100];
struct node
{
    char a[16];
    int d;
} t[maxn];
struct nod
{
    int len;
    int a[100];
} vis[10005];
int Hash(char *name)
{
    long long h=0,g;
    while(*name)
    {
        h=(h<<4)+*name++;
        if(g=h&0xF0000000) h^=g>>24;
        h&=~g;
    }
    h%=10000;
    return (int)h;
}
bool check(char a[],int ans,int n)
{
    for(int i=0; i<vis[ans].len; i++)
    {
        int k=vis[ans].a[i];
        if(strcmp(a,t[k].a)==0) return true;
    }
    return false;
}
int checkall(char a[],int ans,int n)
{
    for(int i=0; i<vis[ans].len; i++)
    {
        int k=vis[ans].a[i];
        if(strcmp(t[k].a,a)==0)
        {
            return k;
        }
    }
    return -1;
}
int main()
{
    int len=0;
    char a[20];
    for(int i=0; i<10005; i++) vis[i].len=0;
    while(scanf("%s",t[len].a)==1&&t[len].a[0]!='#')
    {
        int ans=Hash(t[len].a);
        t[len].d=len;
        vis[ans].a[vis[ans].len]=len;
        vis[ans].len++;
        len++;
    }
    while(scanf("%s",a)==1&&a[0]!='#')
    {
        printf("%s",a);
        int n=strlen(a);
        int ans=Hash(a);
        //if(!vis[ans].len) continue;
        if(check(a,ans,n))
        {
            printf(" is correct\n");
            continue;
        }
        int dd=0;
        printf(":");
        for (int i=0; i<n; i++)//修改
        {
            char e = a[i];
            for(int qq=0; qq<26; qq++)
            {
                a[i]=ww[qq];
                ans=Hash(a);
                int du=checkall(a,ans,n);
                if(du>=0) key[dd++]=du;
            }
            a[i]=e;
        }
        if(n<15)
        {
            for(int i=0; i<=n; i++) //增加一个字母
            {
                char e[20];
                int r = i;
                strcpy(e,a);
                for(int qq=0; qq<26; qq++)
                {

                    for(int t=n; t>r; t--) a[t] = a[t-1];
                    a[r] = ww[qq];
                    a[n+1] = '\0';
                    ans=Hash(a);
                    int du=checkall(a,ans,n+1);
                    if(du>=0) key[dd++]=du;
                    strcpy(a,e);
                }
            }
        }
        if(n>1)
        {
            for(int i=0; i<n; i++)//删除
            {
                char e[20];
                int r = i;
                strcpy(e,a);
                for(int t=r; t<n; t++) a[t] = a[t+1];
                a[n-1]='\0';
                ans=Hash(a);
                int du=checkall(a,ans,n-1);
                if(du>=0) key[dd++]=du;
                strcpy(a,e);
            }
        }
        sort(key,key+dd);
        int k=dd;
        dd=unique(key,key+k)-key;
        for(int i=0; i<dd; i++) printf(" %s",t[key[i]].a);
        printf("\n");
    }
}
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值