题目:
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ’ ’ 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: “42”
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 ‘-’, 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: “4193 with words”
输出: 4193
解释: 转换截止于数字 ‘3’ ,因为它的下一个字符不为数字。
示例 4:
输入: “words and 987”
输出: 0
解释: 第一个非空字符是 ‘w’, 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: “-91283472332”
输出: -2147483648
解释: 数字 “-91283472332” 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
题目理解:
- 这一题其实思路很清楚,无非就是字符串转换成一个整数,只不过在之前我们需要进行一些字符的判断,找到第一个数字的位置,并且记录正负数
- 之后我们每次取一个数字进行计算存储,然后不断相加存储结果即可
- 但是我们还是要注意溢出的判断!
- 这里提供两种解法:一种是普通的循环解法,第二种是有限状态机的解法
解法一(可优化 优化解法在后面):
- 首先排除字符串之前的所有空格‘ ’
- 之后判断第一个非空字符的类型,可能是字母,符号或者数字
- 如果是字母那就直接返回0
- 如果是符号那就修改符号标志位的信息
- 如果是数字那就直接开始循环计算
- 对于符号:我们这里是带符号计算的,也就是说每次都取出一个数都要乘以符号位,这样就不会引起符号的歧义
- 对于溢出:这里也是分别去判断正溢出和负溢出
- 但是实际上优化解法是不带符号计算的,并且判断正溢出和负溢出的时候也仅仅是判断正溢出
public static int myAtoi(String str) {
int result = 0;//记录结果
int i= 0;
while( i < str.length() && str.charAt(i) == ' ') i++;//找到第一个非空格的字符
//如果全是空格 或者第一个字符为字母 但是这里最好先全部转小写的
if(i == str.length() || Character.isLowerCase(str.charAt(i))
|| Character.isUpperCase(str.charAt(i))) {
return 0;
}
int isPositive = 1; //是否为负数的标志位
int j = i;//开始遍历的位置
if(str.charAt(i) == '-' || str.charAt(i) == '+') { //带符号
j++;
if(str.charAt(i) == '-') isPositive = -1;
}
while( j < str.length() && Character.isDigit(str.charAt(j))){
int temp = ((int)str.charAt(j)-'0') * isPositive;
if(result > Integer.MAX_VALUE/10 || (result == Integer.MAX_VALUE / 10 && temp > 7))
return Integer.MAX_VALUE ;
if(result < Integer.MIN_VALUE/10 || (result == Integer.MIN_VALUE / 10 && temp <-8))
return Integer.MIN_VALUE;
result = result*10 + temp;
j++;
}
return result;
}
解法一的优化:
- 我们刚刚可以看到上面的符号位是一直参与计算的,因为要判断正负溢出的原因,但是实际上在判断溢出的时候我们可以直接判断正溢出,从正溢出可以直接返回负溢出的结果。
- 这里我们将符号位去除,不参与计算,也就是说计算的时候只计算正数,那么如果判断正负溢出呢?
- 如果result > 2^31 - 1,这是正溢出,但是却不一定负溢出,因为MIN_VALUE = 2^31,也就是说如果result = 2^31,那么负是不溢出的,这里我们先不考虑这种情况,我们先考虑result > 2^31的情况,这时候正溢出,那么负一定溢出,所以直接根据符号位来判断返回MIN还是MAX即可
- 如果result = 2^31,那么正是溢出的,负不是溢出的,这里就比较巧妙了,哪怕负不是溢出的,那我们也可以直接返回MIN,因为MIN的值就是-2的31次方
- 所以我们这里就很容易去化简这个步骤了!
- 这里只贴出部分代码
while( j < str.length() && Character.isDigit(str.charAt(j))){
int temp = ((int)str.charAt(j)-'0') * isPositive;
if(result > Integer.MAX_VALUE/10 || (result == Integer.MAX_VALUE / 10 && temp > 7))
return isPositive == 1? Integer.MAX_VALUE : Integer.MIN_VALUE;
// if(result < Integer.MIN_VALUE/10 || (result == Integer.MIN_VALUE / 10 && temp <-8))
// return Integer.MIN_VALUE;
result = result*10 + temp;
j++;
}
// return result;
return isPositive == 1? result:(result*-1);
}
解法三(有限状态自动机解法):
- 这个解法也是官方给的解法,意思就是在做字符操作的时候,由于字符有很多的可变性,每判断一个字符会有多种可能,那么就很容易写出非常臃肿的代码算法,所以可以尝试使用有限状态自动机
- 下面是leetcode官网给出的图解:
- 有了这个自动机编写代码就很简单,下面是官网给的c++的解法,后面附带我自己写的java的解法:
class Automaton {
string state = "start";
unordered_map<string, vector<string>> table = {
{"start", {"start", "signed", "in_number", "end"}},
{"signed", {"end", "end", "in_number", "end"}},
{"in_number", {"end", "end", "in_number", "end"}},
{"end", {"end", "end", "end", "end"}}
};
int get_col(char c) {
if (isspace(c)) return 0;
if (c == '+' or c == '-') return 1;
if (isdigit(c)) return 2;
return 3;
}
public:
int sign = 1;
long long ans = 0;
void get(char c) {
state = table[state][get_col(c)];
if (state == "in_number") {
ans = ans * 10 + c - '0';
ans = sign == 1 ? min(ans, (long long)INT_MAX) : min(ans, -(long long)INT_MIN);
}
else if (state == "signed")
sign = c == '+' ? 1 : -1;
}
};
class Solution {
public:
int myAtoi(string str) {
Automaton automaton;
for (char c : str)
automaton.get(c);
return automaton.sign * automaton.ans;
}
};
- java解法:
public static HashMap<String, ArrayList> stable = new HashMap<>();
public static long result = 0;
public static String state = "start";
public static int isPositive = 1;
public static void initStable() {
ArrayList<String> startArr = new ArrayList<>();
startArr.add("start");
startArr.add("sign");
startArr.add("in_number");
startArr.add("end");
ArrayList<String> signArr = new ArrayList<>();
signArr.add("end");
signArr.add("end");
signArr.add("in_number");
signArr.add("end");
ArrayList<String> in_numberArr = new ArrayList<>();
in_numberArr.add("end");
in_numberArr.add("end");
in_numberArr.add("in_number");
in_numberArr.add("end");
ArrayList<String> endArr = new ArrayList<>();
endArr.add("end");
endArr.add("end");
endArr.add("end");
endArr.add("end");
stable.put("start", startArr);
stable.put("sign", signArr);
stable.put("in_number", in_numberArr);
stable.put("end", endArr);
}
public static int gerIndex(char s){
if(s == ' ') return 0;
else if(s == '+' || s == '-') return 1;
else if(Character.isDigit(s)) return 2;
else return 3;
}
public static void getChar(char s){
int index = gerIndex(s);
state = (String)stable.get(state).get(index);
if(state.equals("in_number")){
int temp = (s-'0') * isPositive;
result = result*10 + temp;
if(result > Integer.MAX_VALUE ) result = Integer.MIN_VALUE;
if(result < Integer.MIN_VALUE) result = Integer.MIN_VALUE;
}else if(state.equals("sign")){
if(s == '-') isPositive = -1;
else isPositive = 1;
}
}
public static int myAtoi1(String str) {
initStable();
for(char s: str.toCharArray()){
getChar(s);
}
return (int)result;
}
总结:
本次的刷题对于字符的处理还是发现了自己很多不足的地方:
- 如何判断一个字符是否为数字?这里用到了Character类中的isDigit方法
- 如何判断一个字符是否为字母?还是用到了Character类中的方法Character.isLowerCase(str.charAt(i)) Character.isUpperCase(str.charAt(i)))
- 如何将一个字符转为数字?那么就不能用之前的Integer中的Integer.parseInt()方法,因为这是字符串String转Int的,所以直接用字符减去‘0’即可,这相当于减去‘0’的ascll码
- 如何判断溢出?正负溢出的判断可以简化
- 第一次编写有限状态机,感觉还不错,的确逻辑很清晰