1.如何结构化提取数据如下例子说明
from decimal import Decimal import delorean log = '[2021-02-05T11:07:12.267897] - SALE - PRODUCT: 1345 - PRICE: $09.99' divide_it = log.split(' - ') timestamp_string,_,product_string,price_string = divide_it timestamp = delorean.parse(timestamp_string.strip('[]')) product_id = int(product_string.split(':')[-1]) price = Decimal(price_string.split('$')[-1]) timestamp,product_id,price |
2.输出结果
(Delorean(datetime=datetime.datetime(2021, 5, 2, 11, 7, 12, 267897), timezone='UTC'), 1345, Decimal('9.99')) |
3.输出log日志其中的原理
代码的基本工作是隔离每个元素,然后将它们解析为对应的类型。首先将整个日志分割成更小的部分。“-”是一个明显的分割符号,使用这个”-”符号分割成4个部分:1)时间 2)销售量 3)产品 4)价格。注意:时间是使用标准时间格式,它存放在“[ ]”中。