中文分词—日期识别

最新推荐文章于 2023-05-27 22:16:10 发布

诗雨时

最新推荐文章于 2023-05-27 22:16:10 发布

阅读量667

点赞数 1

分类专栏： python 自然语言处理核心能力提升+实战干货

本文链接：https://blog.csdn.net/weixin_38477351/article/details/109663634

版权

python 自然语言处理核心能力提升+实战干货专栏收录该内容

28 篇文章 5 订阅 ¥99.00 ¥99.00

订阅专栏

超级会员免费看

日期识别

import re
import jieba.posseg as psg

from datetime import datetime, timedelta
from dateutil.parser import parse


UTIL_CN_NUM = {
    '零': 0, '一': 1, '二': 2, '三': 3, '四': 4,
    '五': 5, '六': 6, '七': 7, '八': 8, '九': 9,
    '0': 0, '1': 1, '2': 2, '3': 3, '4': 4,
    '5': 5, '6': 6, '7': 7, '8': 8, '9': 9
}

UTIL_CN_UNIT = {
    "十": 10, "百": 100, "千": 1000, "万": 10000
}


def cn2dig(src):
    """
    通过预定义一些模板，将具体的文本转换成相应的数字。
    :param src:
    :return:
    """
    if not src:
        return None

    m = re.match("\d+", src)
    if m:
        return int(m.group(0))

    rsl = 0
    unit = 1
    for item in s

了解本专栏