题目要求:
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
心得:一开始做题时,比较没有头绪。首先应该先读清题意。在第一个非空格字符出现时就应该进行判断。
读取到空格-> 继续读取下一个
读取到+/- -> 继续读取下一个。下一个还应该是数字
读取到数字 ->开始记录,准备下一个读取
第一个字符不合以上 ->输出结束
自己写的代码:
int myAtoi(char *str)
{
int realLength=strlen(str);
int i=0;
int flag=0;//标记是否开始录入数字
int flagtest=0;//正负数 ,0为正
long res=0;
int max=0x7FFFFFFF,min=0x80000000;
for( i=0; i<realLength; i++)
{
if(str[i]==' ')
{
continue;
flag=0;
}
else if( ( str[i]=='+' || str[i]=='-' ) && flag==0)
{
flag=1;
if(str[i]=='-') flagtest=1; //标记负数
}
else if( str[i]>='0' && str[i]<='9' )
{
flag=1;0
res=res*10+str[i]-'0';
}
else return 0;
}//for
if(flagtest==1) res=-res;
if(res>max) return max;
else if(res<min) return min;
else return res;
}
这段代码中,max和min用来标记int的最大值和最小值,用于后续的判断。输入字符串后进行判断,如果为空格就继续下一个,如果为+、-或者数字,并且flag为0(即表示还未开始识别数字,因为字符串里面可能有多个分隔开的数字组。这段代码能正确识别只有数字、只有字母、空格开头的数字等情况,但数字混合字母识别错误,此外还有其他没能立刻考虑到的情况。
力扣官方题解中使用了编译原理中提到过的状态机。将输入划分为空格、正负号、其他符号和数字,接受字符与下一刻状态机的关系如下图所示:左侧为当前状态,表头为接受到的下一个字符
将表格转化为DFA,如下图:
其官方C++实现如下:
class Automaton {
string state = "start";
unordered_map<string, vector<string>> table = {
{"start", {"start", "signed", "in_number", "end"}},
{"signed", {"end", "end", "in_number", "end"}},
{"in_number", {"end", "end", "in_number", "end"}},
{"end", {"end", "end", "end", "end"}}
};
int get_col(char c) {
if (isspace(c)) return 0;
if (c == '+' or c == '-') return 1;
if (isdigit(c)) return 2;
return 3;
}
public:
int sign = 1;
long long ans = 0;
void get(char c) {
state = table[state][get_col(c)];
if (state == "in_number") {
ans = ans * 10 + c - '0';
ans = sign == 1 ? min(ans, (long long)INT_MAX) : min(ans, -(long long)INT_MIN);
}
else if (state == "signed")
sign = c == '+' ? 1 : -1;
}
};
class Solution {
public:
int myAtoi(string str) {
Automaton automaton;
for (char c : str)
automaton.get(c);
return automaton.sign * automaton.ans;
}
};
在官方题解中,先用一个unordered map,实例化一个二维向量,用于储存状态转移表。而get_col函数用于判断下一个字符的类型。
录入字符时,get函数判断state和get_col对应的table的值,计算并将结果存入ans,后面含三目运算符的语句用于判断结果是否超出int。sign用于判断正负。