数据清洗、可视化工具

数据清洗、可视化工具,阅读笔记

数据清洗

为什么需要清洗?
数据来源不一导致出现
(1)格式不同
(2)数据冗余
(3)没有统一标准,描述方式
(4)数据合并方式不同

数据清理工具:
(1)IBM InfoSphere信息服务器
分析、理解、清洗、监视、转换和传输数据。
(2)Oracle的主数据管理(MDM)
是处理大量数据,并且提供诸如合并、清洗、扩充和同步企业的关键业务数据对象等服务的解决方案。
(3)Equifax
为数据库管理、数据集成和数据分析提供解决方案。
(4)Nneolaki
提供的工具用于数据收集、清理、附加和管理。

(5)更多请阅读文末文章链接

常用机制:
缺失值、特殊值、范围检测、演绎修正、插值、最小值调整、错字、审计和工作流规范检查等。

数据管理

所谓数据整理就是将数据转为格式良好的数据流过程,主要包括排序、解析、提取、分解和恢复数据。

(1)Database Workbench
为使用多个数据库进行开发提供了一个单一的开发环境
(2)InfoSphere 数据架构师(理性数据架构师)
是一种协作式的数据设计方案。它简化了仓库设计、维度建模以及管
理任务的变更。
(3)MySQL Workbench
为数据库架构师、开发人员和数据库管理员提供了统一的可视化工具。MySQL Workbench还提供数据建模、SQL开发和综合管理。
(4)Navicat数据模拟器
有助于创建高质量的逻辑数据模型和物理数据模型。
(5)SQLyog
是一个强大的MySQL管理者和管理工具。

(6)更多请阅读文末文章链接

数据可视化

将数据图示
可视化工具:
(1) InstantAtlas
以有效的视觉方式提供交互式示意图和报告软件
(2)Exhibit
是由麻省理工学院开发的完全开源软件,其有助于创建交互式的示意图和其他基于数据的可视化。
(3)多眼
IBM研发的“多眼”可以帮助用户从数据集创建可视化并启用数据分析。
(4)Gephi
是一款适用于各种网络、复杂系统、动态和分层图形的交互式的可视化探索平台。它支持探索性数据分析、链接分析、社交网络分析以及生物网络分析。该工具为已识别的类似数据集呈现彩色区域。
(5)更多请阅读文末文章链接

摘自原文: 41款实用工具,数据获取、清洗、建模、可视化
微信号公众号 飞马会

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值