数据质量的含义:
数据准确性 合法性一致性,完整性,唯一性,一致性:统一数据来源,精准度,合法性(格式,类型) 及时性
相关软件:
DataCleaner DataCleaner 是一个数据质量分析,比较,验证和监督的软件
Talend Open Profiler 开源数据质量与profile分析
http://blog.csdn.net/orientdawn/article/details/896792 浅谈数据质量管理
Informatica http://datawarehou.se/knowledge/informatica-powercenter-86-download-installation/
图形可视化和数据分析软件有Matlab,Mathmatica和Maple EXCEL MATLAB Origin 等等
开源工具:KETL替代Oracle Data Integration Suite、Informatica
这个提取、转换和加载(ETL)工具提供卓越的可扩展性,使其可与商用工具展开竞争。它融合了最为流行的安全和数据管理工具。操作系统:Linux、Unix。
DataCleaner替代DataFlux Data Management Studio、IBM InfoSphere Master Data Management、Oracle Master Data Management Suite
DataCleaner通过配置、验证和比较数据来确保它的质量。它几乎可以与任何一种数据存储方式协同工作,包括Oracle、MySQL、XML文件、Microsoft SQL和Excel 电子表格等。操作系统:不依赖于操作系统。
Clover ETL替代Oracle Data Integration Suite、Informatica
专为那些“适度数据转换和ETL(提取、转换和加载)的需要”而设计,CloverETL的社区版本可以轻松的将数据在不同类型的数据库和电子表格中移动。对于那些更高级的需要,CloverETL还提供了多种收费版本。操作系统:不依赖于操作系统。
MailArchiva替代ArcMail, Barracuda Message Archiver、GFI Mail Archiver
MailArchiva具有高度的可扩展性,以合规为目的提供了针对电子邮件的长期存储,并且十分易于搜索。除了免费的社区版本,它还有增加了额外功能的付费企业版。操作系统:Windows、Linux。
Talend Open Studio替代Oracle Data Integration Suite、Informatica
Talend为数据集成、主数据管理和应用程序集成提供了多种开源工具。除了免费的开源软件,还提供付费的SaaS版本以及商业支持、服务和培训。操作系统:Windows、Linux、Unix。