1. 题目
请你来实现一个 myAtoi(string s)
函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi
函数)。
函数 myAtoi(string s)
的算法如下:
- 读入字符串并丢弃无用的前导空格;
- 检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。 确定最终结果是负数还是正数。 如果两者都不存在,则假定结果为正。
- 读入下一个字符,直到到达下一个非数字字符或到达输入的结尾。字符串的其余部分将被忽略。
- 将前面步骤读入的这些数字转换为整数(即,“123” -> 123, “0032” -> 32)。如果没有读入数字,则整数为 0 。必要时更改符号(从步骤 2 开始)。
- 如果整数数超过 32 位有符号整数范围 [ − 2 31 , 2 31 − 1 ] [−2^{31}, 2^{31} − 1] [−231,231−1],需要截断这个整数,使其保持在这个范围内。具体来说,小于 − 2 31 −2^{31} −231 的整数应该被固定为 − 2 31 −2^{31} −231 ,大于 2 31 − 1 2^{31} − 1 231−1 的整数应该被固定为 2 31 − 1 2^{31} − 1 231−1。
- 返回整数作为最终结果。
注意:本题中的空白字符只包括空格字符
' '
,除前导空格或数字后的其余字符串外,请勿忽略任何其他字符。
示例 1:
输入:s = “42”
输出:42
解释:加粗的字符串为已经读入的字符,插入符号是当前读取的字符。
第 1 步:“|42”(当前没有读入字符,因为没有前导空格)
第 2 步:“|42”(当前没有读入字符,因为这里不存在 -
或者 +
)
第 3 步:“42|”(读入 “42”)
解析得到整数 42 。由于 “42” 在范围
[
−
2
31
,
2
31
−
1
]
[-2^{31}, 2^{31} - 1]
[−231,231−1] 内,最终结果为 42 。
示例 2:
输入:s = " -42"
输出:-42
解释:
第 1 步:“| -42”(读入前导空格,但忽视掉)
第 2 步:" -|42"(读入 -
字符,所以结果应该是负数)
第 3 步:" -42|"(读入 “42”)
解析得到整数 -42。由于 “-42” 在范围
[
−
2
31
,
2
31
−
1
]
[-2^{31}, 2^{31} - 1]
[−231,231−1] 内,最终结果为 -42 。
示例 3:
输入:s = “4193 with words”
输出:4193
解释:
第 1 步:“|4193 with words”(当前没有读入字符,因为没有前导空格)
第 2 步:“|4193 with words”(当前没有读入字符,因为这里不存在 -
或者 +
)
第 3 步:“4193| with words”(读入 “4193”;由于下一个字符不是一个数字,所以读入停止)
解析得到整数 4193 。由于 “4193” 在范围
[
−
2
31
,
2
31
−
1
]
[-2^{31}, 2^{31} - 1]
[−231,231−1] 内,最终结果为 4193。
提示:
- 1 < = s . l e n g t h < = 200 1 <= s.length <= 200 1<=s.length<=200;
s
由英文字母(大写和小写)、数字(0-9)、' '
、'+'
、'-'
和'.'
组成。
2. 思路及代码实现(Python)
2.1 自动机
这里要注意两个问题,一个是整数溢出问题,即当一个数乘以10并推入一个尾数会超过 INT_MAX
时,则反过来判断推入尾数前的值与 INT_MAX/10
之间的大小关系(参考:LeetCode_7_中等_整数反转)。另一个是每种状态遇到不同的情况的处理逻辑是不同的,如何控制这些复杂的流程而不至于代码过于臃肿(过多的 if-else)。
因此,为了有条理地分析每个输入字符的处理方法,我们可以使用自动机这个概念:程序在每个时刻有一个状态 s
,每次从序列中输入一个字符 c
,并根据字符 c
的值,判断转移到的下一个状态 s'
。这样,我们只需要建立一个覆盖所有情况的从 s
与 c
映射到 s'
的表格即可解决题目中的问题。
自动机的逻辑具体写为表格如下:
" " | +/- | number | other | |
---|---|---|---|---|
start | start | signed | in_number | end |
signed | end | end | in_number | end |
in_number | end | end | in_number | end |
end | end | end | end | end |
根据提示可知,遍历的字符 c
可以分为如上四种情况,空格、正负号、数字、即其他字符。且根据题目逻辑,除了开头的先导空格以及正负号之外,遇到非数字的字符,即可停止,根据自动机这张表格的逻辑,写如下代码:循环判断每个字符的性质,然后更新状态,直到状态为 end
,结束。
算法的时间复杂度为 O ( n ) O(n) O(n),其中 n n n 为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为 O ( 1 ) O(1) O(1)。而空间复杂度为: O ( 1 ) O(1) O(1)。自动机的状态只需要常数空间存储。
INT_MAX = 2 ** 31 - 1
INT_MIN = -2 ** 31
class Automaton:
def __init__(self):
self.state = 'start'
self.sign = 1
self.ans = 0
self.table = {
'start': ['start', 'signed', 'in_number', 'end'],
'signed': ['end', 'end', 'in_number', 'end'],
'in_number': ['end', 'end', 'in_number', 'end'],
'end': ['end', 'end', 'end', 'end'],
}
def get_col(self, c):
if c.isspace():
return 0
if c == '+' or c == '-':
return 1
if c.isdigit():
return 2
return 3
def get(self, c):
self.state = self.table[self.state][self.get_col(c)]
if self.state == 'in_number':
self.ans = self.ans * 10 + int(c)
self.ans = min(self.ans, INT_MAX) if self.sign == 1 else min(self.ans, -INT_MIN)
elif self.state == 'signed':
self.sign = 1 if c == '+' else -1
class Solution:
def myAtoi(self, str: str) -> int:
automaton = Automaton()
for c in str:
automaton.get(c)
return automaton.sign * automaton.ans
执行用时:42 ms
消耗内存:16.50 MB
参考来源:力扣官方题解