ETL
文章平均质量分 80
数控小J
当今世界,正在从数据时代走向大数据时代。百度干了广告的事,淘宝干了超市的事,阿里巴巴干了批发的事,微博干了媒体的事,微信干了通讯的事。不是外行干掉内行,是趋势干掉传统模式,是先进的取代落后的。在信息大爆炸时代,变才是永远的不变,敢于突破和改变,不是你接不接受,是它已经在你身边,而且正在改变你的生活。
展开
-
大数据处理过程之核心技术ETL详解
ETL (数据转换)就是对数据的合并、清理和整合。通过转换,可以实现不同的源数据在语义上的一致性。抛开大数据的概念与基本知识,进入核心。我们从:数据采集、数据存储、数据管理、数据分析与挖掘,四个方面讨论ETL在大数据实际应用中涉及的技术与知识点。转载 2016-05-24 11:29:54 · 17030 阅读 · 0 评论 -
收藏 | 史上最全的“大数据”学习资源(上)
当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。原创 2016-07-20 11:28:33 · 1154 阅读 · 0 评论 -
InfoSphere CDC 实时同步本地数据到云端的BigInsights
IBM InfoSphere CDC 是一款功能强大的数据实时复制软件,不仅广泛应用于传统ODS、数据仓库、数据集市及BI系统的异构平台集成,同时也提供对Cloud的全面支持;对于各种 Cloud 应用场景,CDC 不仅能提供低影响、近实时的海量数据复制,同时还可确保数据在传输过程中的完整性和安全性。原创 2016-07-21 11:33:20 · 3323 阅读 · 0 评论 -
数据访问的穿透能力-Big SQL与关系型数据库的联盟
在某些场景下,Hadoop平台上的数据分析需要用到RMDBS上的数据,每次从数据源移动或复制数据到Hadoop是不现实的,因为您要考虑移动或复制数据的频率、时间成本、管理成本等等。这样,利用Federation技术直接、透明地访问远程RMDBS数据源成为解决问题的有效途径。原创 2016-08-09 10:18:36 · 2141 阅读 · 0 评论 -
数据质量提升必达之路
随着数据量日益剧增,企业决策比以往更需要具备强大的信息管理和掌控能力,协助解决关键问题;若要提升企业竞争优势,必须随时掌握企业内的准确信息,如何去解决数据质量问题是一条必经之路。原创 2016-08-11 10:53:03 · 1416 阅读 · 0 评论 -
IBM InfoSphere DataStage 实时监控和统一运维平台
IBM InfoSphere DataStage Operations Console 是一个基于 Web 的监视工具。它为 InfoSphere DataStage 和 QualityStage 客户提供了 IBM InfoSphere Information Server 引擎操作环境的全面视图,监视当前和过去的作业活动、服务器资源使用情况和服务器引擎流程的健康状态。原创 2017-07-07 10:18:34 · 5346 阅读 · 1 评论