未名企鹅极客 | 基于规则智能识别的数据匹配服务

本文介绍了未名企鹅如何利用数据匹配服务解决医药行业主数据管理难题。研发总监Clark分享了数据匹配的原因、规则转换和智能识别方法,旨在提升数据标准化和处理效率。
摘要由CSDN通过智能技术生成

主数据管理对于医药工业来讲是重中之重,然而在实际管理中总是被杂乱不堪的数据折磨,已有的主数据也无法完成很好的匹配、补充。未名企鹅的数据匹配服务很好的帮助解决这些问题。

本期极客栏目,邀请到未名企鹅的研发总监Clark,从需要数据匹配的原因、数据转换的规则、数据匹配规则的智能识别等几方面深入的介绍了数据匹配服务。

在这里插入图片描述

01

业务背景

数据应用分析的基础是治理好企业所存储的各种脏数据,使它们能为分析所使用。药企现有系统收集存储的第一手数据多为脏数据,很多不准或者不全。

这里面的主要原因是:同一件事物,如经销商、零售、医院等,经不同的人员,录入各类系统时,有着不同的表述,包括不同的简称、俗称、缩写、起名等。由此导致不同线上线下渠道汇总来的同一个终端名称各异,企业内部数据与商品销售流量数据无法打通,导致药企内部数据统计分析费时费力。

数据匹配服务,就是帮助药企对脏数据进行标准化,和已有的主数据进行匹配或者补充。

例如,药品的原始流向数据表:

图片

原始数据标准化表:
图片

对比两个表,可以发现,编号A,B,C的终端名称是和主数据中终端名称是100%一样的,编号D,E,F的终端名称和主数据终端名称是不一致的。

在做数据匹配的工作时,编号A,B,C这样的数据可以由计算机处理为完全匹配,编号D,E,F的数据&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值