最近学习总结

最近写程序,遇到了一些问题然后整理一下解决方法。

  1. 怎么将一句话中的中文数字转换为阿拉伯数字
    比如 “第两千三百二十章” —> 2320
    方法一: 可以使用cn2an
    参考链接:Python使用cn2an实现中文数字与阿拉伯数字的相互转换
    有normal模式和smart模式,分别可以将“一二三”转换为“123”、“一万二”转换为12000

但是我安装这个包出错了,所以没有用。

方法二:
Python实现中文数字转换为阿拉伯数字的方法示例
python将中文数字与阿拉伯数字互换

代码如下:

def trans_han_to_nums(uchars_chinese):
    common_used_numerals_tmp ={'零':0, '一':1, '二':2, '两':2, '三':3, '四':4, '五':5, '六':6, '七':7, '八':8, '九':9, '十':10, '百':100, '千':1000, '万':10000, '亿':100000000}
    common_used_numerals = {}
    for key in common_used_numerals_tmp:
        common_used_numerals[key.encode('utf-8').decode('utf-8')] = common_used_numerals_tmp[key]
    if u'十' in new_chapter_han or u'百' in new_chapter_han or u'千' in new_chapter_han:    #解决“一万二”这种问题
        total = 0
        r = 1              # 表示单位:个十百千...
        for i in range(len(uchars_chinese) - 1, -1, -1):
            val = common_used_numerals.get(uchars_chinese[i])
            if val >= 10 and i == 0:  
                if val > r:
                    r = val
                    total = total + val
                else:
                    r = r * val
            elif val >= 10:
                if val > r:
                    r = val
                else:
                    r = r * val
            else:
                total = total + r * val
    else:            #解决“一二三”这种问题
        val = []
        for s in uchars_chinese:
            val.append(str(common_used_numerals.get(s)))
        num = ''.join(val)
        total = eval(num)   
    return total

new_chapter_nums = trans_han_to_nums(new_chapter_han.encode('utf-8').decode('utf-8'))

tips: 改了一下链接1中的cp936,cp936为gbk编码,换成了utf-8,还有先编码再解码,不知道为啥需要这样,不然会报错。

  1. 提取出的数字可能以0开头,这样就不能比较大小,因此,需要
    判断数字是否以0开头,是的话去掉0
if new_chapter_num.startswith('0'):
	new_chapter_nums = eval(new_chapter_num[1:])

使用了startswith() 函数。

  1. 怎么根据某个字把字符串分开,比如“第两千三百二十章 终结” 提取出“两千三百二十”
new_chapter = '第两千三百二十章  终结'
new_chapter_temp = new_chapter.split('章')[0][1:]   #两千三百二十

e.g.

s=‘hello! my word’
print s.split()
#输出结果为[‘hello!’, ‘my’, ‘word’]
  1. 判断字符串是否为字母或数字
    参考链接Python判断字符串是否为字母或者数字

isdigit()、isalpha()、isalnum()函数

但我的需求是判断一句话种是否有数字,因此这个方法不适合,采用的是:

new_chapter_temp = '第230章'
if bool(re.search(r'\d', new_chapter_temp))#如果有数字则为True
	print('xx')    

–>> xx

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值