一、题目
输入一个文本,找出所有不同的单词(连续的字母序列),按字典序从小到大输出。单词不区分大小写。
样例输入:
Adventures in Disneyland Two blondes were going to Disneyland
when they came to a fork in the road. The sign read: “Disneyland
Left.” So they went home.
样例输出:
a
adventures
blondes
came
disneyland
fork
going
home
in
left
read
road
sign
so
the
they
to
two
went
were
when
二、思路,步骤,代码以及说明
1. 思路分析
小白思路:就是先把所有单词放到一个vector数组里面,然后for循环从头开始用字符串比较函数比较每一个单词,如果之前没出现过该单词,就加入一个新的vector里面。最终打印即可。程序思维简单好懂,但是麻烦。
现在来看进阶的思路:用set集合即可很好的解决这个问题。
重点: set里面不能有重复的元素,所以这个例题就是最典型的set集合例题。(底层算法:红黑树)
2.步骤
逐个读取单词和空格,顺便把大写字母换成小写字母,然后把这些输入的字符串以流的形式赋值给ss,然后ss又以流的形式把字符串给dict集合。最后用迭代器输出即可(用普通的循环输出也可以)
2.代码
#include<iostream>
#include<string>
#include<set>
#include<sstream>
using namespace std;
set<string> dict; //string 集合
int main() {
string s, buf;
while (cin >> s) {//输入字符串,输入ctrl+Z的时候停止
for (int i = 0; i < s.length(); i++)
if (isalpha(s[i])) s[i] = tolower(s[i]); else s[i] = ' ';
stringstream ss(s);//将s中的内容复制到新string类型数据ss中
while (ss >> buf) dict.insert(buf);//把ss中的数据复制给buf数组
}
for (set<string>::iterator it = dict.begin(); it != dict.end(); ++it)//迭代器
cout << *it << "\n";
return 0;
}
3.说明(也算一个知识回顾和巩固吧)
(1)cin>>相当于cin.operator>>(),即调用成员函数operator()进行读取数据。cin是从缓冲区读取数据的,但是当缓冲区数据是空格,tab或者换行这些分隔符的时候,cin>>会将其自动清理,并且继续读取下一个字符,若缓冲区为空则继续等待,如果读取成功,字符后面的分隔符是残留在缓冲区的,cin>>不做处理。
(2)set是一个集合,并且里面的元素会自动排序好变成按照从小到大的顺序排序,用一个for循环就可以遍历所有的元素。
(3)set::iterator是一个迭代器,具体相关知识需要百度。
(4)isalpha函数的作用是判断该字符是不是字母,大写字母返回2,小写字母返回1,不是字母的话就返回0。
(5)tolower函数的作用是把大写字母转为小写字母。
(6)stringstream是流的输入输出操作,在头文件sstream中。