前言
流向数据作为药企营销管理的核心,在提高盈利水平、决策生产上有着重要的地位。在“新基建”的大背景下,数据准确性,匹配高效性,信息及时性这三大特性也成为行业竞争中的重要指标。
承接上文,完整的流向交付需要依赖清洗匹配系统强大的匹配能力以及行业库系统准确严格的准入机制。但在此之前,一套标准的数据采集流程是必不可少的。数据采集系统作为数据处理业务的最上游系统,肩负着数据收集、检查、传递的职责,在此过程中,信息的及时性尤为重要。本文将为大家分享未名企鹅数据采集系统是如何做到实时无误的。
1
多渠道定时数据采集
未名企鹅的数据采集系统根据客户的需求提供了多个渠道的采集方式包括:
· DDI小程序采集
· Web自动采集
· API接口采集
· FPT上传采集
同时根据客户的数据更新习惯定期(日、周、月)、定时(通常在午夜12时至早上8时之间)进行数据采集。期间若由于网络原因或客户电脑原因导致数据采集失败,系统会保证在不影响客户系统的情况下尝试进行多次采集,直到数据被正确的采集到为止。
2
数据问题检查、人工催收及配置解析
1.1 问题检查及催收
当原始流向数据被采集到系统,系统将从四个层面对数据进行检查,目的是为了保证客户原始数据的可用性,从而在后续系统处理的过程中不会因为原始数据问题影响交付质量。
对于问题数据系统会立即生成催收任务,并提醒相关催收人员进行处理。催收人员需要和商业公司电话确认数据问题原因,如果不能立即修正数据,则需要催收人员写明问题原因及下次催收时间,便于及时跟进问题。同时,对于连续多次数据异常的商业,系统会自动统计汇总并提示催收人员重点关注。
1.2 配置解析
由于采集的客户众多,每家提供的原始流向字段均不同,但表达的意义相同,例如:商品名称、产品名称、产品、药品,其实都指的是销售的东西。数量、出库量、出货量代表的都是数据。此时就需要根据不同客户字段名称特点进行映射关系配置,将原始字段名称统一映射为数据库固有的字段名称并在原始数据无问题时进行解析检查,若在解析的过程中发现问题,也会第一时间通知系统相关工作人员进行配置检查,从而保证数据进一步流转。
3
与清洗匹配系统对接
完整数据采集流程包含四部分内容:
1、根据客户提供的渠道自动采集数据;
2、检查原始流向是否存在数据问题;
3、按客户配置规则解析原始流向,形成系统可识别数据;
4、自动生成清洗匹配系统可处理的数据处理任务。
当一份原始流向经过层层检查无误后,系统将今日采集到的数据整理、聚合并自动生成清洗匹配任务传递给清洗系统,工作人员会在第一时间优先进行匹配、质检处理,可以达到极短的时间内交付日级别的数据的目的。
4
系统服务监控及进销存自平衡检查
为了保证采集质量,除了原始文件层面的检查,系统还会对正在运行的程序及服务进行相关监控包括:
· 客户端心跳活跃检查
· 客户端版本监控及远程下发版本
· 客户端SQL异常监控
· 自动异常检查
· 自动目标网站健康检查
等其他检查项,目的是为了保证采集程序的正常工作,同时不会影响客户对外提供数据系统的正常使用。
同时系统还会定期根据各商业采集回来的数据进行进销存平衡检查,基于人工设定的期初期末库存时间计算理论库存和实际库存,对未能够达到进销存平衡的品种进行报警,提示工作人员与商业确认数据信息,保证后续交付的数据质量。
5
总的来说,数据采集系统需要从三个方面保证信息的及时传递:
· 第一 :采集程序正常工作,异常则需要及时报警;
· 第二 :原始流向符合检查规则,异常则需要及时催收;
· 第三 :与清洗匹配系统及时交互,自动生成待处理任务。
只有在这三个方面做到最优,才能提高与下游系统间的交互效率,准确、高效、及时的交付数据,赢得客户满意。
文 / Zihao
编辑 / TiK
关于未名企鹅
未名企鹅以“连接健康”为使命,致力于提供生命健康领域的大数据产品和解决方案,帮助客户实现数据驱动的业务增长。
未名企鹅,数 · 智 · 未来