简单得从一段口语中找出时间标记,以供后面使用
现在还不是很好,凑合用吧
#coding:utf8
import re
x = u'[^一二三四五六七八九十]*(二十[一二三四]?|十[一二三四五六七八九]|[一二三四五六七八九])(点[整钟半]*)\s?([一二三四五六七八九十]{0,3})[分|分钟]?.*'
reg = re.compile(x)
a = u'十一点二十八分'
b = u'二十点整'
c = u'三点半'
d = u'三点五十'
e = u'三点三十二分钟'
f = u'二十二点三十八'
s1 = reg.match(a)
print s1.groups(), s1.group(1), s1.group(3)
s2 = reg.match(b)
print s2.groups(), s2.group(1), s2.group(3)
s3 = reg.match(c)
print s3.groups(), s3.group(1), s3.group(3)
s4 = reg.match(d)
print s4.groups(), s4.group(1), s4.group(3)
s5 = reg.match(e)
print s5.groups(), s5.group(1), s5.group(3)
s6 = reg.match(f)
print s6.groups(), s6.group(1), s6.group(3)