编程珠玑之第二章questionC: 求变位词问题

问题描述:
C. 给定一个英语词典,找出其中的所有变位词集合。例如,“pots”、“stop”和“tops”互为变位词,因为每一个单词都可以通过改变其他单词中的字母的顺序来得到。
问题解析:
1、变位词具有相同的长度,相同的字符,唯一的区别就是这些相同的字符按照不同的顺序排列成不同的字符串而已。如果有一种方法唯一标识这些相同的字符,那么这个问题好解决了。

解决方案:

方案1:按照字母顺序对每个单词进行标识并把这些具有相同标识的词集合到一起。
(1)将输入文件中的所有单词加标识并输出到另一个文件中。代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
#include <cstdio>
#include <cstdlib>       // qsort
#include <cctype>        // toupper\tolower
#include <cstring>       // strlen
#include <cassert>       // assert

#define     WORDMAX      100
#define error( str )         fatal_error( str )
#define fatal_error( str )   fprintf( stderr,  "%s\n", str ), exit(  1 )

int charcomp( const  void* x,  const  void* y) {  return *( char*)x - *( char*)y; }

/************************************************************************/
// 函数名称:mytolower
// 函数目的:将字符串中的大写字符转为小写字符
// 函数参数:lword:转换后的字符串,word:要转换的字符串
// 函数返回:转换后的字符串
// 使用条件:
/************************************************************************/

char* mytolower( char* lword,  char* word)
{
     while ( *word !=  '\0' ){
         if (isalpha(*word) && isupper(*word)){ *lword++ = tolower(*word++); }
         else { *lword++ = *word++; }
    }
    *lword =  '\0';   // 末尾加结束字符

     return lword;
}

/************************************************************************/
// 函数名称:add_sign
// 函数目的:获取单词标识并输出到文件中
// 函数参数:rfile:要读文件,wfile:要写的文件
// 函数返回:无
// 使用条件:输入的单词长度小于100
/************************************************************************/

void add_sign(FILE* rfile, FILE* wfile)
{
    assert(rfile !=  NULL && wfile !=  NULL);

     char word[WORDMAX], lword[WORDMAX], sign[WORDMAX];

      while(fscanf(rfile,  "%s", word) != EOF){
        mytolower(lword, word);
        strcpy(sign, lword);
        qsort(sign, strlen(sign),  sizeof( char), charcomp);

        fprintf(wfile,  "%s\t%s\r\n", sign, word);
     }

     return;
}


int main()
{
    FILE* rfile = fopen( "dictionary.txt""r");
     if ( NULL ==  rfile){ fatal_error( "不能打开dictionary.txt文件!\n"); }

    FILE* wfile = fopen( "sign_dictionary.txt""w");
     if ( NULL == wfile){ fatal_error( "不能打开sign_dictionary.txt文件!\n"); }

    add_sign(rfile, wfile);
    
    fclose(rfile);
    fclose(wfile);

    printf( "生成完毕!!");
     return  0;
}
简单的测试数据 dictionary.txt和生成的数据 sign_dictionary.txt见:

http://download.csdn.net/detail/johnnyhu90/8346745

(2)将有标识的输出文件中所有的词依(标识,单词)对的形式存储到内存。这里使用C++的mutimap和set来完成,代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#include <iostream>
#include <map>
#include <set>
#include <string>
using  namespace std;

/************************************************************************/
// 函数名称:print_anagrams
// 函数目的:输出打印所有的变位词
// 函数参数:rfile:要读文件
// 函数返回:无
// 使用条件:rfile是有(标识、变位词)对的文件
/************************************************************************/

void print_anagrams(FILE* rfile)
{
     char word[WORDMAX], sign[WORDMAX];
    multimap<string,string> angrams;
    std::set<string> myset;

     while(fscanf(rfile,  "%s\t%s", sign, word) != EOF){
        myset.insert(sign);
        angrams.insert(std::make_pair(sign, word));
    }

     for (set<string>::iterator iter = myset.begin(); iter != myset.end(); ++iter) {
        multimap<string, string>::iterator it = angrams.equal_range(*iter).first;
         for (; it != angrams.equal_range(*iter).second; ++it){
            std::cout <<  ' ' << (*it).second;
        }
        cout << endl;
    }

     return;
}

int main()
{
    FILE* rfile = fopen( "sign_dictionary.txt""r");
     if ( NULL == rfile){ fatal_error( "不能打开sign_dictionary.txt文件!\n"); }

    print_anagrams(rfile);
    
    fclose(rfile);
    printf( "执行完毕!!");
     return  0;
}
输出结果如下:


心得与疑惑:
1、当我们把所有的单词进行标识并且将标识和其对应的单词存储到硬盘的一个文件中,那么怎么样对这个文件按照标识进行排序(假设内存不能够一次性全部加载这些数据)?



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编程珠玑》是由美国计算机科学家Jon Bentley编写的一本经典书籍,第二版修订版pdf是该书的一种电子书格式。该书是一本关于编程问题和解决方法的指南,涵盖了算法、数据结构、程序设计等方面的知识。 第二版修订版pdf相比于第一版,进行了一些修订和更新。更新内容主要包括了一些新的编程问题和相应的解决方法,以及对一些已有问题的更详细的说明和讨论。此外,修订版还可能加入一些新的案例分析和实践经验,以帮助读者更好地理解和应用书中的内容。 作为一本经典的编程书籍,《编程珠玑》在计算机科学和编程领域具有很高的声誉和影响力。读者通过学习该书,可以提高自己解决编程难题的能力和思维方式,深入理解算法和数据结构的原理和应用,提升编程技巧和代码质量。 对于想要阅读《编程珠玑》的读者,选择第二版修订版pdf是一种方便和经济的方式。pdf格式可以在电子设备上阅读,无需携带纸质书籍,随时随地都可以学习。而且,修订版相对于第一版,内容更加全面和详细,更适合新手和有一定编程基础的读者阅读和学习。 综上所述,《编程珠玑》第二版修订版pdf是一本经典的编程书籍的电子格式,通过学习该书,读者可以提高自己的编程能力和思维方式,了解算法和数据结构的原理和应用。阅读第二版修订版pdf是一种便捷和经济的方式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值