mapper.xml在一个页面中显示两张表的部分数据_快速链接你的数据 玩转数据分析...

本文介绍了DataFocus如何帮助用户链接和管理来自不同数据源的数据,包括本地文件和各种数据库。通过数据管理功能,用户可以导入和同步数据,支持CSV、Excel、TXT等多种格式,并提供了数据清理和预处理功能。DataFocus还支持定时更新和批量导入Excel,确保数据的实时性和一致性。此外,文章详细阐述了直连数据和导入数据的区别,以及如何配置数据表关联,包括左连接、右连接、内连接等,强调了避免扇形陷阱和断层陷阱的重要性。数据模型部分,解释了数据类型、星形模型和雪花模型的概念,指导用户构建高效的数据分析模型。
摘要由CSDN通过智能技术生成

第二章 链接你的数据

无论是个人还是企业,需要分析的数据正在变得越来越多,数据的来源也变得越来越多样,这些待分析的数据往往分散在多个数据库、文本文件、电子表格,外部数据源中。DataFocus为用户提供了整合各种数据源的“数据管理”功能模块,用户可以通过它连接各种各样主流的数据库,也可以上传或者同步本地excel文件。DataFocus标准版以上产品的数据管理模块包含了大数据仓库和内存计算引擎。用户接入的数据都将以列式存储的格式保存在数仓中,这保证了分析计算的高效性。

2.1链接你的数据

2.1.1 连接本地文件

打开DataFocus系统,点击左侧数据管理,然后点击右侧操作按钮,点击导入数据。可导入本地CSV、TXT、XLS、XLSX以及JSON等本地数据文件。选中后点击上传,并确认行列属性是否正确。若行列属性不正确(如数值保留了字符串格式未转化为数值格式),则无法进行可视化分析。适用于一些本地已有文件(如一些店铺数据或是自录数据表)的分析,或是一些未购买数据库的企业。

23f48980b28ca693c0300798ff56aab2.png

图2-1 本地数据导入界面

导入本地数据,大小限制为50MB。本地Excel文件经常存在数据不规范的问题,DataFocus的数据导入模块提供了简单的数据清理功能,具体操作为在导入数据时点击高级按钮,会展开一系列选项,用户可以设置跳过行、读取行数、跳过注释行、拆分列等操作,进行简单的数据清理。

d80d3d0331b8e49191a61a355a2cf921.png

图2-2 本地数据导入高级配置

2.1.2 批量导入Excel数据

对于大量的,经常更新的本地数据源,DataFocus还提供了excel文件批量同步工具。比如有些小企业或工厂经常采用excel进行数据管理,他们将数据存放在某些固定的文件夹中,并定时更新。这种场景,就可以通过设定excel批量同步工具定时将excel数据追加上传到DataFocus的数据仓库中进行分析。

9e3867bb5deda4a267e365b8f139ed54.png

图2-3批量导入Excel工具的下载

DataFocus Sync tool提供了丰富的数据同步追加功能,以及数据清洗和预处功能,足以允许部分习惯于使用excel进行数据管理的企业平滑的将其数据迁移到DataFocus中来。使用前需要用户在服务参数配置中填入对应的服务器地址和对应的Key。

a1b6d62576d7e460a1700ea1c04fb31e.png

图2- 4 DataFocus Synctool配置界面

服务参数SecretID和SecretKey通过DataFocus系统的用户页面点击用户标识,生成对应的Key。用户完成配置连接成功后,同步工具将自动扫描所选文件夹,整理和汇总对应的数据表,如果服务器搭建在云端,应采用https加密连接方式进行。同步工具还提供了数据清理功能,用户可以自主配置规则对数据表进行过滤和筛选,这对不规范的excel表非常有用,还可以设定定时导入功能以便用户定时同步追加数据到DataFocus的服务端。DataFocuaMini及以上版本均支持同步工具的导入。

f1cf83b2566ba4fb1020adf05be26799.png

图2-5 生成同步工具的key

2.1.3 连接数据库

点击左侧数据管理模块,点击上方数据源按钮,点击右侧新建数据源,可点击直连数据和导入数据。需要注意的是,导入数据为数据导入到DataFocus自带大数据仓库,直连数据为直接抽取服务器数据进行分析。若是操作大量分析,建议使用导入数据,DataFocus数据仓库性能可保障分析顺畅,否则直连数据分析则依靠对方设备的性能。数据导入后,可点击上方“开始”则可进行导入,列表可查看导入状态。

导入数据支持定时更新,更新频率一般为每天、每周、每月。直连数据可支持实时更新,数据库中数据有变化,DataFocus中直连的这些表,以及依赖这些表制作的报表等也都能实时更新。

b654e8557ac0ec3f719100d2e5949a9e.png

图2-6 链接数据库

f4ebf2cc9d26d822f751414baf274258.png

图2-7 数据库链接方式

2.1.4 直连数据和导入数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值