请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
题干是转发而来
官方结题思路
方法一:自动机
思路
字符串处理的题目往往涉及复杂的流程以及条件情况,如果直接上手写程序,一不小心就会写出极其臃肿的代码。
因此,为了有条理地分析每个输入字符的处理方法,我们可以使用自动机这个概念:
我们的程序在每个时刻有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 转移到下一个状态 s'。这样,我们只需要建立一个覆盖所有情况的从 s 与 c 映射到 s' 的表格即可解决题目中的问题。
算法
本题可以建立如下图所示的自动机:
我们也可以用下面的表格来表示这个自动机:
接下来编程部分就非常简单了:我们只需要把上面这个状态转换表抄进代码即可。
另外自动机也需要记录当前已经输入的数字,只要在 s' 为 in_number 时,更新我们输入的数字,即可最终得到输入的数字。
// 自动状态机, 编译原理里面的内容,的确是很少接触给忘记了,下面附上官方python 自动状态机代码,官方代码还是很简洁
INT_MAX = 2 ** 31 - 1
INT_MIN = -2 ** 31
class Automaton:
def __init__(self):
self.state = 'start'
self.sign = 1
self.ans = 0
self.table = {
'start': ['start', 'signed', 'in_number', 'end'],
'signed': ['end', 'end', 'in_number', 'end'],
'in_number': ['end', 'end', 'in_number', 'end'],
'end': ['end', 'end', 'end', 'end'],
}
def get_col(self, c):
if c.isspace():
return 0
if c == '+' or c == '-':
return 1
if c.isdigit():
return 2
return 3
def get(self, c):
self.state = self.table[self.state][self.get_col(c)]
if self.state == 'in_number':
self.ans = self.ans * 10 + int(c)
self.ans = min(self.ans, INT_MAX) if self.sign == 1 else min(self.ans, -INT_MIN)
elif self.state == 'signed':
self.sign = 1 if c == '+' else -1
class Solution:
def myAtoi(self, str: str) -> int:
automaton = Automaton()
for c in str:
automaton.get(c)
return automaton.sign * automaton.ans
- 时间复杂度:O(n)O(n),其中 nn 为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为 O(1)O(1)。
- 空间复杂度:O(1)O(1),自动机的状态只需要常数空间存储。
惯例附上Java 大神的代码:
解法一://大神的说法是,DFA解法,我是不懂的,慢慢理解,重点是简介,而且边界值的判断,让我耳目一新
class Solution {
public int myAtoi(String str) {
str = str.trim();
if (str.length() == 0) return 0;
if (!Character.isDigit(str.charAt(0))
&& str.charAt(0) != '-' && str.charAt(0) != '+')
return 0;
long ans = 0L;
boolean neg = str.charAt(0) == '-';
int i = !Character.isDigit(str.charAt(0)) ? 1 : 0;
while (i < str.length() && Character.isDigit(str.charAt(i))) {
ans = ans * 10 + (str.charAt(i++) - '0');
if (!neg && ans > Integer.MAX_VALUE) {
ans = Integer.MAX_VALUE;
break;
}
if (neg && ans > 1L + Integer.MAX_VALUE) {
ans = 1L + Integer.MAX_VALUE;
break;
}
}
return neg ? (int) -ans : (int) ans;
}
}
解法二:利用正则解法,我不知道改解法是不是能通过官方的测试案例,非常重要的一点是,溢出通过异常判断是不提倡的。但是该题的确已经解了。
import java.util.regex.*;
class Solution {
final static Pattern pattern = Pattern.compile("[-+]??[0-9]++");
public int myAtoi(String str) {
String strTrim = str.trim();
Matcher matcher = pattern.matcher(strTrim);
if (matcher.lookingAt()) {
String strNum = strTrim.substring(0, matcher.end());
// 如果直接转32位int出现NFE那么就只要判断是Integer的最大值还是最小值就好了
try {
return Integer.parseInt(strNum);
} catch (NumberFormatException nfe) {
return strNum.charAt(0) == '-' ? Integer.MIN_VALUE : Integer.MAX_VALUE;
}
}
return 0;
}
}
小弟low 的解法,太过复杂,重点是被测试案例按在地上摩擦,边界值判断没有继续解决。是错误的,不提倡,但是思路是新奇的,哈哈。
简而言之,替换
public int myAtoi(String str) {
if (str == "" || str == null) {
return 0;
}
str = str.replaceAll("\\s", "");
// Pattern pattern = Pattern.compile("[0-9]*");
// Matcher matcher = pattern.matcher(str);
return getRealNum(str);
}
private Integer getRealNum(String str) {
if (str.startsWith("0")) {
return new Integer("0");
}
String values = str;
String flag = null;
if (str.startsWith("-") || str.startsWith("+")) {
flag = str.substring(0, 1);
values = str.substring(1, str.length());
}
if(values == "" || values == null) {
return new Integer("0");
}
values = getValue(values);
if (Long.parseLong(values) > Integer.MAX_VALUE) {
if (flag != null) {
return new Integer(flag.equals("-") ? Integer.MIN_VALUE : Integer.MAX_VALUE);
} else {
return Integer.MAX_VALUE;
}
} else {
return new Integer(flag != null ? flag + values : values);
}
}
private String getValue(String str) {
String strTransform = str.replaceFirst("\\D", "*");
if (strTransform.contains("*")) {
if (strTransform.startsWith("*")) {
return "0";
}
return strTransform.substring(0, strTransform.indexOf("*"));
} else {
return str;
}
}
@Test
public void test1() {
System.out.println(myAtoi(" -42"));
System.out.println(myAtoi(""));
System.out.println(myAtoi(null));
System.out.println(myAtoi("4193 with words"));
System.out.println(myAtoi("-91283472332"));
System.out.println(myAtoi("words and 987"));
}