识别日期:
可以使用Python中的dateutil库来解析日期字符串,以下是示例代码:
from dateutil.parser import parse
text = "2022年3月30号"
date = parse(text, fuzzy=True)
print(date)
输出结果为:
2022-03-30 00:00:00
python如何分词,得到日用Python中的分词库和日期时间库。
分词:
常用的分词库有jieba、thulac、pkuseg等。以下是使用jieba分词的示例代码:
import jieba
text = "2022年3月30号是个好日子,今天是3月30号,明天就是月末了。"
words = jieba.lcut(text)
print(words)
输出结果为:
['2022', '年', '3', '月', '30', '号', '是', '个', '好', '日子', ',', '今天', '是', '3', '月', '30', '号', ',', '明天', '就', '是', '月末', '了', '。']
此外,也可以使用Python中的re模块(正则表达式)来匹配日期字符串。
识别“今天”、“月末”等特殊词汇:
可以使用Python中的datetime库来处理日期。以下是示例代码:
from datetime import datetime, date, timedelta
# 今天
today = date.today()
# 月末
last_day_of_month = date(today.year, today.month, 1) + timedelta(days=32) - timedelta(days=1)
print(today)
print(last_day_of_month)
输出结果为:
2023-03-30
2023