问题描述:
给定一个化学式formula
(作为字符串),返回每种原子的数量。
原子总是以一个大写字母开始,接着跟随0个或任意个小写字母,表示原子的名字。
如果数量大于 1,原子后会跟着数字表示原子的数量。如果数量等于 1 则不会跟数字。例如,H2O 和 H2O2 是可行的,但 H1O2 这个表达是不可行的。
两个化学式连在一起是新的化学式。例如 H2O2He3Mg4 也是化学式。
一个括号中的化学式和数字(可选择性添加)也是化学式。例如 (H2O2) 和 (H2O2)3 是化学式。
给定一个化学式,输出所有原子的数量。格式为:第一个(按字典序)原子的名子,跟着它的数量(如果数量大于 1),然后是第二个原子的名字(按字典序),跟着它的数量(如果数量大于 1),以此类推。
示例 1:
输入:
formula = "H2O"
输出: "H2O"
解释:
原子的数量是 {'H': 2, 'O': 1}。
示例 2:
输入:
formula = "Mg(OH)2"
输出: "H2MgO2"
解释:
原子的数量是 {'H': 2, 'Mg': 1, 'O': 2}。
示例 3:
输入:
formula = "K4(ON(SO3)2)2"
输出: "K4N2O14S4"
解释:
原子的数量是 {'K': 4, 'N': 2, 'O': 14, 'S': 4}。
注意:
- 所有原子的第一个字母为大写,剩余字母都是小写。
formula
的长度在[1, 1000]
之间。formula
只包含字母、数字和圆括号,并且题目中给定的是合法的化学式。
问题分析:
很显然,这是一个递归题目,可以使用递归实现、栈实现,还有大神用正则来解决的,具体的大家可以去网上搜索。现在参考了@cnkyzz大神的程序,进行一下学习总结。个人偏好还是非递归较好,感觉还是for循环和栈跑的快哈。其,基本思路是:
(1)从右向左遍历 formula 字符串,这样处理的好处是,可以比较方便推出字符(原子)的系数 coeff。
(2)遇到数字时,则记录在变量 cnt 中,其中 i 用于记录数字的位数(原子的系数不仅仅是个位数的)。
(3)遇到符号 ')' 时,则把当前的数字 cnt 压栈,即把符号 ')' 右边的数字进栈。
(4)遇到符号 '(' 时,则把当前栈顶原子出栈,即把相对应的 ')' 右边的数字出栈。
(5)遇到大写字母时,把当前的原子变量 elem 放入字典,(注意个数的计算,要考虑之前是否已经存在)。
(6)遇到小写字母时,保留到当前原子变量 elem 中。
(7)最后,字典排序,按照要求输出。
Python3实现:
注:collections.defaultdict(int) 表示创建一个类似dictionary对象,里面任何的values都是int的实例,而且就算是一个不存在的key, d[key] 也有一个默认值,这个默认值是int类型,且默认值为 0.
import collections
class Solution:
def countOfAtoms(self, formula):
dic, coeff, stack, elem, cnt, i = collections.defaultdict(int), 1, [], '', 0, 0
for c in formula[::-1]:
if c.isdigit():
cnt += int(c) * (10 ** i) # 获取当前数子
i += 1 # 当前数字的位数
elif c == ')': # 当前数字入栈,并更新当前原子的系数
stack.append(cnt)
coeff *= cnt
i = cnt = 0
elif c == '(': # 出栈,并更新当前系数(相除哦)
coeff //= stack.pop()
i = cnt = 0
elif c.isupper(): # 原子写入字典,
elem = c + elem
dic[elem] += (cnt or 1) * coeff # 当前数字 * 当前的系数 + 之前已经存在的个数。
elem = ''
i = cnt = 0
elif c.islower(): # 拼接,保留到 elem 中
elem = c + elem
return ''.join(k + str(v > 1 and v or '') for k, v in sorted(dic.items()))
if __name__ == '__main__':
solu = Solution()
formula = 'K4(ON(SO3)2)2'
print('formula:', 'K4(ON(SO3)2)2')
print(solu.countOfAtoms(formula))
欢迎指正哦。