题目
请你来实现一个 atoi
函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
- 本题中的空白字符只包括空格字符
' '
。 - 假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回
INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
解题思路
解法一:正则表达式
^:匹配字符串开头
[\+\-]:代表一个+字符或-字符
?:前面一个字符可有可无
\d:一个数字
+:前面一个字符的一个或多个
\D:一个非数字字符
*:前面一个字符的0个或多个
解法二:常规判断
需要注意的两个点:
1)在转化过程中防止超过 INT_MAX(或INT_MIN),其中 INT_MAX = 2147483647;INT_MIN = -2147483648
法一:设 res保存之前的正数值。若 flag = 1 为正数,flag = -1 则为负数,cur 表示当前位要加的数。因此若当前的 res > 214748364 时,继续计算就一定会溢出,即 res > INT_MAX / 10 时会溢出。而若 res = 214748364,即 res == INT_MAX / 10 时:对于正数,当此时加的数 cur >= 7 则会正溢出,即 flag == 1 && cur >= 7 正溢出;对于负数,当此时加的数 cur >= 8 则会负溢出,即 flag == -1 && cur >= 8 负溢出。
法二:数据必须满足 res * 10 + cur <= INT_MAX,转化一下也即 res <= (INT_MAX - cur)/10 时不会导致溢出。也就是说有可能会在某一步 res * 10 + cur > INT_MAX。因为 *10 和 + cur 都有可能导致数据溢出,那么只要把这些都移到右边去就可以了。即 res > (INT_MAX - cur) / 10 时就会导致溢出。
2)求int的最大值和最小值。
当然也可以直接写数字,这里可以巧妙地运用位运算。直接左移31位可能会影响符号位,所以分三步。
第一步,先将 1 左移30位,然后减一。此时二进制为 0011,1111,1111,1111,1111,1111,1111,1111,即两个0 和 30 个1。
第二部,左移一位。此时二进制为 0111,1111,1111,1111,1111,1111,1111,1110,即一个 0 和 30 个1 和 1 个 0。
第三步,再加一。
即 INT_MAX = (((1 << 30)-1)<<1) + 1。
代码
解法一:正则表达式
import re
class Solution:
def myAtoi(self, str: str) -> int:
INT_MAX = 2147483647
INT_MIN = -2147483648
str = str.lstrip() #清除左边多余的空格
num_re = re.compile(r'^[\+\-]?\d+') #设置正则规则
num = num_re.findall(str) #查找匹配的内容
num = int(*num) #由于返回的是个列表,解包并且转换成整数
return max(min(num,INT_MAX),INT_MIN) #返回值
解法二:常规判断
代码1
class Solution:
INT_MAX = 2**31 - 1
INT_MIN = -2**31
def myAtoi(self, str: str) -> int:
if not str:
return 0
# 去掉空格
str = str.strip()
size = len(str)
i = 0
res = 0
sign = 1
# 首字符决定正负号
if i < size and (str[i] == '+' or str[i] == '-'):
sign = 1 if str[i] == '+' else -1
i += 1
while i < size and ('0' <= str[i] <= '9'):
# 先处理越界,并取10整除,因为先判断越界再做后面运算,所以要判断是否超过最大值的整除10的数
# res > self.INT_MAX // 10 对应最小边界
# res == self.INT_MAX // 10 and (ord(str[i]) - ord('0') > 7) 对应最大边界, 这里7是因为(2**31 - 1) % 10 = 7
if res > self.INT_MAX // 10 or (res == self.INT_MAX // 10 and (ord(str[i]) - ord('0') > 7)):
if sign == 1:
return self.INT_MAX
else:
return self.INT_MIN
res = res * 10 + ord(str[i]) - ord('0')
i += 1
return res * sign
代码2
class Solution:
def myAtoi(self, str: str) -> int:
INT_MAX = 2**31-1
INT_MIN = -2**31
if not str:
return 0
# 去掉空格
str_ = str.strip()
size = len(str_)
i = 0
res = 0
sign = 1
# 判断正负号
if i < size and str_[i] == '+':
sign = 1
i += 1
elif i < size and str_[i] == '-':
sign = -1
i += 1
# 必须先判断是否会溢出才能做后面运算
while i < size and '0'<=str_[i]<='9':
if res > (INT_MAX - int(str_[i]))//10:
if sign == 1:
return INT_MAX
elif sign == -1:
return INT_MIN
res = res * 10 + int(str_[i])
i += 1
return sign* res