题目描述
Tom教授正在给研究生讲授一门关于基因的课程,有一件事情让他颇为头疼:一条染色体上有成千上万个碱基对,它们从0开始编号,到几百万,几千万,甚至上亿。
比如说,在对学生讲解第1234567009号位置上的碱基时,光看着数字是很难准确的念出来的。
所以,他迫切地需要一个系统,然后当他输入12 3456 7009时,会给出相应的念法:
十二亿三千四百五十六万七千零九
用汉语拼音表示为
shi er yi san qian si bai wu shi liu wan qi qian ling jiu
这样他只需要照着念就可以了。
你的任务是帮他设计这样一个系统:给定一个阿拉伯数字串,你帮他按照中文读写的规范转为汉语拼音字串,相邻的两个音节用一个空格符格开。
注意必须严格按照规范,比如说“10010”读作“yi wan ling yi shi”而不是“yi wan ling shi”,“100000”读作“shi wan”而不是“yi shi wan”,“2000”读作“er qian”而不是“liang qian”。
输入
有一个数字串,数值大小不超过2,000,000,000。
输出
是一个由小写英文字母,逗号和空格组成的字符串,表示该数的英文读法。
样例输入
1234567009
样例输出
shi er yi san qian si bai wu shi liu wan qi qian ling jiu
解决:将数字以四位为一组进行划分
将数字以四位为一组划分,如1234567009划分为12, 3456, 7009。这种划分方式是自然的,因为中文即按照个十百千四位为一组进行计数的。
而每四位之中的读法又具有规律性,故定义函数geshibaiqian,传入四位一组的数字num,进行四位数字的解读。同时根据传入的counter,判断是位于‘亿’所处的四位、‘万’所处的四位,还是‘个’所处的四位。
对于每四位数字的转换,需注意以下几点:
1. 若数字仅由两位数组成且以1打头,则需读成十;
2. 若数字中部出现0(即num[i]=='0' 而 num[i+1]!='0'),则需要读成零;
3. 若数字最后一位是0,则需跳过不念。如2200读成两千两百,1110读成一千一百一十,末位的零只有在数字为0是需读出。
num = str(input())
pinyin = ['ling', 'yi', 'er', 'san', 'si', 'wu', 'liu', 'qi', 'ba', 'jiu'] # 数字对应的拼音读法
wei = ['','shi','bai','qian'] # 十、百、千
danwei = ['','wan', 'yi'] # 万、亿
def geshibaiqian(num, counter): # 四位作为一组进行处理,counter用于记录当前处于哪四位
ret = []
if len(num)==2 and num[0]=='1': # 当num为两位数且首位是1时,需要读成十
ret.append('shi')
ret.append(pinyin[int(num[1])])
ret.append(danwei[counter])
return ret
for i in range(len(num)):
if num[i]=='0' and i < len(num)-1: # 若数中部出现0,则需要读成零
if num[i+1] != '0':
ret.append('ling')
continue # 连续有0
if not (num[i]=='0' and i==len(num)-1): # 若num最后一位是0,则不应读成0,跳过该位.如2200读成两千两百
ret.append(pinyin[int(num[i])])
ret.append(wei[len(num)-1-i])
ret.append(danwei[counter])
return ret
if num=='0':
print('ling')
else:
ans = []
counter = 0 # counter用于记录处于哪个四位组合中
while num:
ans.append(geshibaiqian(num[-4:], counter))
num = num[:-4]
counter += 1
for i in range(len(ans)-1, -1, -1):
for j in range(len(ans[i])):
if ans[i][j] != '':
print(ans[i][j], end=' ')