日期识别
import re
import jieba.posseg as psg
from datetime import datetime, timedelta
from dateutil.parser import parse
UTIL_CN_NUM = {
'零': 0, '一': 1, '二': 2, '三': 3, '四': 4,
'五': 5, '六': 6, '七': 7, '八': 8, '九': 9,
'0': 0, '1': 1, '2': 2, '3': 3, '4': 4,
'5': 5, '6': 6, '7': 7, '8': 8, '9': 9
}
UTIL_CN_UNIT = {
"十": 10, "百": 100, "千": 1000, "万": 10000
}
def cn2dig(src):
"""
通过预定义一些模板,将具体的文本转换成相应的数字。
:param src:
:return:
"""
if not src:
return None
m = re.match("\d+", src)
if m:
return int(m.group(0))
rsl = 0
unit = 1
for item in s