核心操作
//FOLLOW集
//#表示结束标志
set<char> Follow[255];
1.follow 函数
*初始化: 首先将文法的开始符号的 FOLLOW 集合中加入特殊结束符号#。
*迭代更新: 函数使用一个while 循环来反复更新 FOLLOW 集合,直到没有新的元素被添加到任何 FOLLOW 集合中
*处理每个产生式:
*遍历每个非终结符的产生式,对于产生式中的每个符号,特别是非终结符,需要更新其 FOLLOW 集合。
*如果产生式中的某个非终结符后面紧跟着终结符,则将该终结符加入非终结符的 FOLLOW 集合。
*如果非终结符后面是另一个非终结符,则将后者的 FIRST 集合(除去空串)加入前者的 FOLLOW 集合。
*如果非终结符后面的符号串的 FIRST 集合包含空串,或者该非终结符是产生式的最后一个符号,则将产生式左侧非终结符的 FOLLOW 集合加入该非终结符的 FOLLOW 集合。
*更新检查: 检查在每次迭代后 FOLLOW 集合的大小是否发生变化,以决定是否继续迭代。
2.输出 FOLLOW 集合: print_follow 函数用于打印每个非终结符的 FOLLOW 集合。
具体实现
#include <iostream>
#include <set>
#include <algorithm>
#include <vector>
#include <string>
#include <fstream>
using namespace std;
//G文法结构体
struct G {
int Vt_number;
int Vn_number;
int P_number;
set<char> Vt;
set<char> Vn;
char S;
vector<string> P[255];
}G_instance;
//打印文法
void printG() {
cout << "Vt is:";
for (auto i = G_instance.Vt.begin(); i != G_instance.Vt.end(); i++) {
cout << *i << " ";
}
cout << endl;
cout << "Vn is:";
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << *i << " ";
}
cout << endl;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
cout << *i << "->" << *p << endl;
}
}
}
}
//FIRST集
set<char> First[255];
set<char> first_string_set;
void first_string(string str) {
first_string_set.clear();
for (int i = 0; i < str.length(); i++) {
set<char> temp_first_sub_string;
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), First[str[i]].begin(), First[str[i]].end(), inserter(temp_first_sub_string, temp_first_sub_string.begin()));
if (First[str[i]].find('$') != First[str[i]].end() && i != str.length() - 1) {
temp_first_sub_string.erase('$');
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), first_string_set.begin(), first_string_set.end(), inserter(first_string_set, first_string_set.end()));
}
else {
set_union(temp_first_sub_string.begin(), temp_first_sub_string.end(), first_string_set.begin(), first_string_set.end(), inserter(first_string_set, first_string_set.end()));
break;
}
}
}
void check() {
for (auto vn = G_instance.Vn.begin(); vn != G_instance.Vn.end(); vn++) {
if (!G_instance.P[*vn].empty()) {
for (auto p = G_instance.P[*vn].begin(); p != G_instance.P[*vn].end(); p++) {
first_string(*p);
set_union(first_string_set.begin(), first_string_set.end(), First[*vn].begin(), First[*vn].end(), inserter(First[*vn], First[*vn].begin()));
}
}
}
}
void first() {
//flag为1表示first集有更新
// 0表示first集无更新
int flag = 1;
while (flag == 1) {
flag = 0;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i的产生式
//*p为当前的产生式
int len = First[*i].size();
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//首字符为终结符号
if (G_instance.Vt.find((*p)[0]) != G_instance.Vt.end()) {
First[*i].insert((*p)[0]);
}
else {
//首字符为非终结符号
for (int index = 0; index < (*p).length(); index++) {
//temp为FIRST(Y_k)
set<char> temp;
set_union(temp.begin(), temp.end(), First[(*p)[index]].begin(), First[(*p)[index]].end(), inserter(temp, temp.begin()));
if (temp.find('$') != temp.end() && index != (*p).length() - 1) {
temp.erase('$');
set_union(First[*i].begin(), First[*i].end(), temp.begin(), temp.end(), inserter(First[*i], First[*i].end()));
}
else {
set_union(First[*i].begin(), First[*i].end(), temp.begin(), temp.end(), inserter(First[*i], First[*i].end()));
break;
}
}
}
}
}
int new_len = First[*i].size();
if (new_len > len) {
flag = 1;
}
}
}
//终结符号的first集
for (auto i = G_instance.Vt.begin(); i != G_instance.Vt.end(); i++) {
First[*i].insert(*i);
}
check();
}
//打印first集
void print_first() {
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << "first(" << *i << "):";
for (auto item = First[*i].begin(); item != First[*i].end(); item++) {
cout << *item << " ";
}
cout << endl;
}
}
//FOLLOW集
//#表示结束标志
set<char> Follow[255];
void follow() {
Follow[G_instance.S].insert('#');
//flag为1表示FOLLOW集有更新
// 0 无更新
int flag = 1;
while (flag == 1) {
flag = 0;
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//*p为当前非终结符号*i->产生式*p
for (int j = 0; j < (*p).length(); j++) {
char temp_vn = (*p)[j];
int len = Follow[temp_vn].size();
if (G_instance.Vn.find(temp_vn) != G_instance.Vn.end()) {
//当前字符为产生式中最后一个字符
if (j == (*p).length() - 1) {
set_union(Follow[temp_vn].begin(), Follow[temp_vn].end(), Follow[*i].begin(), Follow[*i].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
else {
string temp_string = (*p).substr(j + 1, (*p).length() - j - 1);
//后继first集中包含空
first_string(temp_string);
if (first_string_set.find('$') != first_string_set.end()) {
first_string_set.erase('$');
set_union(first_string_set.begin(), first_string_set.end(), Follow[temp_vn].begin(), Follow[temp_vn].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
set_union(Follow[temp_vn].begin(), Follow[temp_vn].end(), Follow[*i].begin(), Follow[*i].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
else {
//后继first集不含空
set_union(first_string_set.begin(), first_string_set.end(), Follow[temp_vn].begin(), Follow[temp_vn].end(), inserter(Follow[temp_vn], Follow[temp_vn].end()));
}
}
}
if (len < Follow[temp_vn].size()) {
flag = 1;
}
}
}
}
}
}
}
void print_follow() {
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
cout << "follow(" << *i << "):";
for (auto item = Follow[*i].begin(); item != Follow[*i].end(); item++) {
cout << *item << " ";
}
cout << endl;
}
}
//SELECT集
string M[255][255];
void select() {
//初始化M
for (int i = 0; i < 255; i++) {
for (int j = 0; j < 255; j++) {
M[i][j] = "";
}
}
for (auto i = G_instance.Vn.begin(); i != G_instance.Vn.end(); i++) {
//遍历非终结符号*i
if (!G_instance.P[*i].empty()) {
for (auto p = G_instance.P[*i].begin(); p != G_instance.P[*i].end(); p++) {
//*p为当前非终结符号*i->产生式*p
set<char> select;
first_string(*p);
if (first_string_set.find('$') != first_string_set.end()) {
set_union(Follow[*i].begin(), Follow[*i].end(), select.begin(), select.end(), inserter(select, select.end()));
}
first_string_set.erase('$');
set_union(first_string_set.begin(), first_string_set.end(), select.begin(), select.end(), inserter(select, select.end()));
for (auto select_ = select.begin(); select_ != select.end(); select_++) {
M[*i][*select_] = *p;
}
cout << "SELECT(" << *i << "->" << *p << "):";
for (auto p_s = select.begin(); p_s != select.end(); p_s++) {
cout << *p_s << " ";
}
cout << endl;
}
}
}
}
void print_select(int sum) {
ofstream p;
string file_path = "output" + to_string(sum) + ".csv";
p.open(file_path, ios::out | ios::trunc);
p << "Vn" << ",";
set<char> input_set;
set_union(input_set.begin(), input_set.end(), G_instance.Vt.begin(), G_instance.Vt.end(), inserter(input_set, input_set.begin()));
input_set.erase('$');
input_set.insert('#');
for (auto vt = input_set.begin(); vt != input_set.end(); vt++) {
p << *vt << ",";
}
p << endl;
for (auto vn = G_instance.Vn.begin(); vn != G_instance.Vn.end(); vn++) {
p << *vn;
for (auto vt = input_set.begin(); vt != input_set.end(); vt++) {
if (M[*vn][*vt] != "") {
p << "," << *vn << "->" << M[*vn][*vt];
}
else {
p << "," << " ";
}
}
p << endl;
}
p.close();
}
void clear() {
G_instance.P_number = 0;
G_instance.Vn_number = 0;
G_instance.Vt_number = 0;
G_instance.S = ' ';
for (int i = 0; i < 255; i++) {
G_instance.P[i].clear();
Follow[i].clear();
First[i].clear();
}
G_instance.Vn.clear();
G_instance.Vt.clear();
first_string_set.clear();
for (int i = 0; i < 255; i++) {
for (int j = 0; j < 255; j++) {
M[i][j] = "";
}
}
}
int main() {
string file_path = "./FIRST-FOLLOW.txt";
ifstream file(file_path);
string arr[100];
int count = 0;
int sum = 0;
while (getline(file, arr[count]) && count < 100) {
if (arr[count].empty()) {
clear();
G_instance.P_number = count;
G_instance.S = arr[0][0];
for (int i = 0; i < count; i++) {
int len = arr[i].length();
string str = arr[i];
G_instance.Vn.insert(str[0]);
G_instance.P[str[0]].push_back(str.substr(2, len - 2));
for (int index = 0; index < len; index++) {
if ((str[index] >= 'a' && str[index] <= 'z') || str[index] == '$') {
G_instance.Vt.insert(str[index]);
}
}
}
G_instance.Vt_number = G_instance.Vt.size();
G_instance.Vn_number = G_instance.Vn.size();
printG();
cout << endl;
count = 0;
first();
print_first();
follow();
print_follow();
select();
sum++;
print_select(sum);
cout << endl;
}
else {
count++;
}
}
file.close();
return 0;
}