先上代码:
import re
class Solution(object):
def myAtoi(self, str):
str = str.strip()
#[-+]表示第一个字符为正负号,?表示匹配正负号0次或1次,\d表示数字,+表示匹配数字一到无限次
digit_str = re.match(r'[-+]?\d+', str)
if(digit_str == None):
return 0
else:
digit_int = int(digit_str.group())
INT_MAX = ((1 << 31) - 1)
INT_MIN = (-1 << 31)
if digit_int>INT_MAX:
return (INT_MAX)
elif digit_int<INT_MIN:
return (INT_MIN)
else:
return (digit_int)
思路:
用正则表达式来匹配,这样效率最高,代码最简洁,难点是怎么理解需要提取的正则表达式,以及正则表达式怎么写。提取出来之后处理一下溢出的情况,就ok了。
我们要提取的目标字符串,第一个字符可以是正负号,也可以没有符号,第一个字符就是数字。用 [-+] 表示可以是正号或者符号(or),接着的?表示前面一项匹配0-1次,表明正负号可以不出现,或者只出现一次。表示数字的是/d,我们要把连续的数字都算上,那么这一项就会匹配一到无穷次,我们在 \d 后面接上 + 表示匹配一到无穷次。到这里就搞定了。
小记:
这是AC之后我在官方解答看到的解法,非常值得学习。不用正则表达式的话,代码会不可避免地冗长一点,以下放上我的一般解法。
class Solution(object):
def myAtoi(self, str):
nums = '0123456789'
#处理特殊输入
if str == '': return 0
if len(str) == 1 and str not in nums: return 0
n = len(str)
#截取第一个非空格字符之后的子串
rest = ''
for i in range(n):
if str[i] != ' ':
if str[i] == '-':
rest = str[i:]
break
elif str[i] == '+':
rest = str[i+1:]
break
elif str[i] in nums:
rest = str[i:]
break
else:
return 0
if rest == '': return 0
print rest
#符号之后必须跟着数字
if rest[0] not in nums and len(str) != 1 and (str[i+1] not in nums and str[i+1] != '.'):
print "hey"
return 0
num = ''
#去掉连续数字之后的非数字字符
for i in range(len(rest)):
#首字符为负号
if i == 0 and rest[i] == '-':
num += '-'
continue
#是数字则加入字符串
if rest[i] in nums:
num += rest[i]
else:
break
print num,"here"
#排除溢出情况
num = int(num)
if num >= 2147483648:
return 2147483647
if num <= -2147483648:
return -2147483648
return num