剑指offer67.把字符串转换为整数(大数越界)

题目

写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。

当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。

该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽略,它们对于函数不应该造成影响。

注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0。

说明:

假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−2^31,  2^31 − 1]。如果数值超过这个范围,请返回  INT_MAX (2^31 − 1) 或 INT_MIN (−2^31) 。

示例 1:输入: "42"     输出: 42
示例 2:输入: "   -42"      输出: -42          解释: 第一个非空白字符为 '-', 它是一个负号。我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:输入: "4193 with words"    输出: 4193       解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:输入: "words and 987"    输出: 0     解释: 第一个非空字符是 'w', 但它不是数字或正、负号。因此无法执行有效的转换。
示例 5:输入: "-91283472332"      输出: -2147483648      解释: 数字 "-91283472332" 超过 32 位有符号整数范围。 因此返回 INT_MIN (−2^31) 。

解题思路

根据题意,有四种字符要考虑:

(1)首部空格:删除

(2)符号位:三种情况,即‘+’、‘-’‘无符号’,新建一个变量保存符号位,返回前判断正负即可

(3)非数字字符:遇到首个非数字的字符时,应立即返回

(4)数字字符:

  • 字符转数字:‘此数字的ASCII码’与‘0的ASCII码’相减
  • 数字拼接:若从左向右遍历数字,设当前位字符为c,当前位数字为x,数字结果为res,则数字拼接公式为:res=10*res+x,其中x=ascii(c)-ascii('0')

 数字越界处理:在每轮数字拼接前,判断res在此轮拼接后是否超过2147483647,若超过则加上符号位直接返回。设数字拼接边界bndry=2147483647//10=214748364,则有两种情况越界:

  • 情况一:执行拼接10*res>=2147483650越界,即res>bndry
  • 情况二:拼接后是2147483548或2147483649越界,即res=bndry,x>7

 代码

class Solution:
    def strToInt(self, str: str) -> int:
        str = str.strip()                      # 删除首尾空格
        if not str: return 0                   # 字符串为空则直接返回
        res, i, sign = 0, 1, 1
        int_max, int_min, bndry = 2 ** 31 - 1, -2 ** 31, 2 ** 31 // 10
        if str[0] == '-': sign = -1            # 保存负号
        elif str[0] != '+': i = 0              # 若无符号位,则需从 i = 0 开始数字拼接
        for c in str[i:]:
            if not '0' <= c <= '9' : break     # 遇到非数字的字符则跳出
            if res > bndry or res == bndry and c > '7': return int_max if sign == 1 else int_min # 数字越界处理
            res = 10 * res + ord(c) - ord('0') # 数字拼接
        return sign * res

其中,为什么要c>'7'呢,res == number && chars[j] > '7' 的意思是,当res == number时,即:214748364,此时res * 10 变成 2147483640 此时没越界,但是还需要 + chars[j],而int最大值为 2147483647,所以当chars[j] > 7 时会越界。

python当中的ord()函数返回对应的是 ASCII 数值。

复杂度

  • 时间复杂度:O(N),其中N为字符串长度,线性遍历字符串占用O(N)时间
  • 空间复杂度:O(N),删除首尾空格后需建立新字符串,最差情况下占用O(N)额外空间
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值