LeetCode_8_中等_字符串转换整数


1. 题目

请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。

函数 myAtoi(string s) 的算法如下:

  1. 读入字符串并丢弃无用的前导空格;
  2. 检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。 确定最终结果是负数还是正数。 如果两者都不存在,则假定结果为正。
  3. 读入下一个字符,直到到达下一个非数字字符或到达输入的结尾。字符串的其余部分将被忽略。
  4. 将前面步骤读入的这些数字转换为整数(即,“123” -> 123, “0032” -> 32)。如果没有读入数字,则整数为 0 。必要时更改符号(从步骤 2 开始)。
  5. 如果整数数超过 32 位有符号整数范围 [ − 2 31 , 2 31 − 1 ] [−2^{31}, 2^{31} − 1] [231,2311],需要截断这个整数,使其保持在这个范围内。具体来说,小于 − 2 31 −2^{31} 231 的整数应该被固定为 − 2 31 −2^{31} 231 ,大于 2 31 − 1 2^{31} − 1 2311 的整数应该被固定为 2 31 − 1 2^{31} − 1 2311
  6. 返回整数作为最终结果。

注意:本题中的空白字符只包括空格字符 ' ',除前导空格或数字后的其余字符串外,请勿忽略任何其他字符。

示例 1:

输入:s = “42”
输出:42
解释:加粗的字符串为已经读入的字符,插入符号是当前读取的字符。
第 1 步:“|42”(当前没有读入字符,因为没有前导空格)
第 2 步:“|42”(当前没有读入字符,因为这里不存在 - 或者 +
第 3 步:“42|”(读入 “42”)
解析得到整数 42 。由于 “42” 在范围 [ − 2 31 , 2 31 − 1 ] [-2^{31}, 2^{31} - 1] [231,2311] 内,最终结果为 42 。

示例 2:

输入:s = " -42"
输出:-42
解释:
第 1 步:“| -42”(读入前导空格,但忽视掉)
第 2 步:" -|42"(读入 - 字符,所以结果应该是负数)
第 3 步:" -42|"(读入 “42”)
解析得到整数 -42。由于 “-42” 在范围 [ − 2 31 , 2 31 − 1 ] [-2^{31}, 2^{31} - 1] [231,2311] 内,最终结果为 -42 。

示例 3:

输入:s = “4193 with words”
输出:4193
解释:
第 1 步:“|4193 with words”(当前没有读入字符,因为没有前导空格)
第 2 步:“|4193 with words”(当前没有读入字符,因为这里不存在 - 或者 +
第 3 步:“4193| with words”(读入 “4193”;由于下一个字符不是一个数字,所以读入停止)
解析得到整数 4193 。由于 “4193” 在范围 [ − 2 31 , 2 31 − 1 ] [-2^{31}, 2^{31} - 1] [231,2311] 内,最终结果为 4193。


提示

  • 1 < = s . l e n g t h < = 200 1 <= s.length <= 200 1<=s.length<=200
  • s 由英文字母(大写和小写)、数字(0-9)、' ''+''-''.' 组成。

2. 思路及代码实现(Python)

2.1 自动机

这里要注意两个问题,一个是整数溢出问题,即当一个数乘以10并推入一个尾数会超过 INT_MAX 时,则反过来判断推入尾数前的值与 INT_MAX/10 之间的大小关系(参考:LeetCode_7_中等_整数反转)。另一个是每种状态遇到不同的情况的处理逻辑是不同的,如何控制这些复杂的流程而不至于代码过于臃肿(过多的 if-else)。

因此,为了有条理地分析每个输入字符的处理方法,我们可以使用自动机这个概念:程序在每个时刻有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 的值,判断转移到的下一个状态 s'。这样,我们只需要建立一个覆盖所有情况的从 sc 映射到 s' 的表格即可解决题目中的问题。

在这里插入图片描述
自动机的逻辑具体写为表格如下:

" "+/-numberother
startstartsignedin_numberend
signedendendin_numberend
in_numberendendin_numberend
endendendendend

根据提示可知,遍历的字符 c 可以分为如上四种情况,空格、正负号、数字、即其他字符。且根据题目逻辑,除了开头的先导空格以及正负号之外,遇到非数字的字符,即可停止,根据自动机这张表格的逻辑,写如下代码:循环判断每个字符的性质,然后更新状态,直到状态为 end,结束。

算法的时间复杂度为 O ( n ) O(n) O(n),其中 n n n 为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为 O ( 1 ) O(1) O(1)。而空间复杂度为: O ( 1 ) O(1) O(1)。自动机的状态只需要常数空间存储。

INT_MAX = 2 ** 31 - 1
INT_MIN = -2 ** 31

class Automaton:
    def __init__(self):
        self.state = 'start'
        self.sign = 1
        self.ans = 0
        self.table = {
            'start': ['start', 'signed', 'in_number', 'end'],
            'signed': ['end', 'end', 'in_number', 'end'],
            'in_number': ['end', 'end', 'in_number', 'end'],
            'end': ['end', 'end', 'end', 'end'],
        }
        
    def get_col(self, c):
        if c.isspace():
            return 0
        if c == '+' or c == '-':
            return 1
        if c.isdigit():
            return 2
        return 3

    def get(self, c):
        self.state = self.table[self.state][self.get_col(c)]
        if self.state == 'in_number':
            self.ans = self.ans * 10 + int(c)
            self.ans = min(self.ans, INT_MAX) if self.sign == 1 else min(self.ans, -INT_MIN)
        elif self.state == 'signed':
            self.sign = 1 if c == '+' else -1

class Solution:
    def myAtoi(self, str: str) -> int:
        automaton = Automaton()
        for c in str:
            automaton.get(c)
        return automaton.sign * automaton.ans

执行用时:42 ms
消耗内存:16.50 MB

参考来源:力扣官方题解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值