编译原理关于对求文法First集的实现
思路:
* 若X->a..,则将终结符a加入FIRST(X)中;(注意非终结符的情况)
*
* 若X->e ,则将终结符e加入FIRST(X)中(e表示空集);
*
* 若 X->BC..D,则将First(B)所有元素(除了空集)加入First(A),然后检测First(B)
* 若First(B)中不存在空集, 即e,则停止,
* 若存在则向B的后面查看,将First(C)中所有元素(除了空集)加入First(A),
* 然后再检测First(C)中是否有e...直 到最后,
* 若D之前的所有非终结符的First集中都含有e,则检测到D时,将First(D)也加入First(A),若First(D)中含有e,则将 e加入First(A)。
现采用JAVA代码实现如下:
private void createFirst() {
boolean _ALTERED_ = true; // 判断是否对First集进行过修改
for (int i = 0; i < non_terminals.size(); i++) {
firsts.add(new First()); // 为firsts集合分配空间
}
while (_ALTERED_) {
_ALTERED_ = false; // 算法一开始先置将_ALTERED_置为false,表示未修改过
for (int i = 0; i < non_terminals.size(); i++) { // 循环对每一个非终结符进行判断
for (int j = 0; j < productions.size(); j++) { // 循环对文法中的每一条产生式进行判断
String i_non_terminals = non_terminals.get(i); // 第i个非终结符
Production j_production = productions.get(j); // 第j条产生式
if (j_production.leftPart.equals(i_non_terminals)) {
// 第j条产生式的左部就是这个非终结符
if (!firsts.get(i).getFirst().contains(j_production.rightParts.get(0))
&& terminals.contains(j_production.rightParts.get(0))) {
// 第j条产生式的右部的第一个字符是终结符,就将这个字符添加到第i个非终结符对应first集中
firsts.get(i).getFirst().add(j_production.rightParts.get(0));
_ALTERED_ = true;
} else if (non_terminals.contains(j_production.rightParts.get(0))) {
// 第j条产生式的右部的第一个字符不是终结符,而是非终结符,那么要把第j条产生式右部第一个字符的first集中的所有元素添加到第i个非终结符的first集中。
if (firsts.get(i)
.setFirst(firsts.get(non_terminals.indexOf(j_production.rightParts.get(0))))) { //遍历非终结符的First集,把不在i非终结符中的加入第i个非终结符的first集
_ALTERED_ = true;
}
//如果第j条产生式右部的第一个非终结符的first集中包含$,将第j条产生式右部的第二个符号也添加到first集中
if(firsts.get(non_terminals.indexOf(j_production.rightParts.get(0))).getFirst().contains("~")) {
if(j_production.rightParts.size() > 1) {
int Index=1;
while(Index<j_production.rightParts.size())
{
if(non_terminals.contains(j_production.rightParts.get(Index))
&&!(firsts.get(non_terminals.indexOf(j_production.rightParts.get(Index))).getFirst().contains("~")))
break; //如果是非终结符且其first集合不含空产生式,则退出
if (!firsts.get(i).getFirst().contains(j_production.rightParts.get(Index))
&& terminals.contains(j_production.rightParts.get(Index))) {
// 第j条产生式的右部的第一个字符是终结符,就将这个字符添加到第i个非终结符对应first集中
firsts.get(i).getFirst().add(j_production.rightParts.get(Index));
_ALTERED_ = true;
Index++;
continue;
}
else if (non_terminals.contains(j_production.rightParts.get(Index))) {
// 第j条产生式的右部的第一个字符不是终结符,而是非终结符,那么要把第j条产生式右部第一个字符的first集中的所有元素添加到第i个非终结符的first集中。
if (firsts.get(i)
.setFirst(firsts.get(non_terminals.indexOf(j_production.rightParts.get(Index))))) {
_ALTERED_ = true;
Index++;
continue;
}
}
Index++;
}
}
}
}
}
}
}
}
}