自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(39)
  • 收藏
  • 关注

转载 全球最佳15个免费云存储服务推荐

据国外媒体报道,对一般用户来说,除非需要1TB以上超大容量存储空间,很少人愿意付费获得一个云存储。其实有很多云存储厂商,都会提供一些小容量的免费云存储给一般用户,对只需要存储一些照片、文档的用户来说,5GB、10GB容量足矣。不用再花钱扩容存储卡,以下15个小容量免费存储服务推荐

2011-09-19 16:20:47 3849

原创 linux网址大全

linux网址大全 1Virtuabox 虚拟机克隆方法http://www.cnblogs.com/foxhengxing/archive/2010/09/10/1822899.html2jdk安装:http://blog.163.com/zjc_8886/blog

2011-09-13 16:38:32 263

原创 hadoop总结2

http://blog.csdn.net/lmc_wy/article/details/6035543 Hadoop 0.20.2 集群配置ubuntu10.10http://blog.csdn.net/yanical/article/details/4474830 Wind

2011-09-08 12:03:42 165

原创 网页地址分享工具

http://www.jiathis.com/help/html/what-is-jiathis   jiathishttp://www.passit.cn/bookmark.html                   passithttp://share.baidu.

2011-09-07 17:52:25 407

原创 程序员常去地网址

1 J2me开发网 http://www.j2medev.com/bbs/index.asp2 J2me社区 http://www.j2meforums.com/forum/3 csdn http://www.csdn.net/4 Vc知识库 http://www.v

2011-09-07 15:33:12 280

原创 it英语学习网址列表

it英语学习网址列表 http://ebiquity.umbc.edu/

2011-09-07 10:52:39 300

转载 oracle warehouse builder 在ETL 中的数据质量控制

参考网址:http://database.ctocio.com.cn/tips/265/7419765.shtmlETL是非常重要的一步,往往一个项目的成败就是看ETL过程的成功与否.选用一个好的ETL工具会让项目更加的有信心  数据质量一直是ETL工具的一个

2011-09-06 20:37:08 687

原创 Kettle 与 Talend Open Studio 的 ETL 比较

原文地址:http://my.oschina.net/ychenIntegration/blog/23807 Pentaho Data Integration (Kettle)是Pentaho生态零碎中默许的ETL对象。经过十分直不雅的图形化编纂器(Spoon),您可以界说以XM

2011-09-06 20:26:29 2322

原创 talend+教程网址

http://www.talendforge.org/tutorials/menu.php?src=HomepageSpecial  talend 教程网址http://www.talendforge.org/  点击tutorials  选择data quality

2011-09-06 20:16:13 3908

原创 Pentaho

Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。功能和特

2011-09-06 19:48:32 430

原创 hadoop结构说明

Hadoop的结构:pDFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员只要用较少的代码就可以完成分布式程序的开发,这使得开发人员只需要关注业务逻辑的即可Hadoop 是Apache

2011-09-06 17:56:17 408

原创 hadoop开发环境搭建

Hadoop分布式的好处:DFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员只要用较少的代码就可以完成分布式程序的开发,这使得开发人员只需要关注业务逻辑的即可Hadoop的windo

2011-09-06 17:50:33 642

原创 hadoop收集

Hadoop核心项目提供了在低端硬件上构建云计算环境的基础服务,它也提供了运行在这个云中的软件所必须的API接口。Hadoop内核的两个基本部分是MapReduce框架,也就是云计算环境,和Hadoop分布式文件系统 (HDFS)。Hadoop核心MapReduce框架需要一

2011-09-06 17:48:44 282

原创 数据质量体系结构介绍

数据质量管理过程是一个没有终点的过程,也没有统一架构原则。这里提供的是一种针对数据仓库项目可以简单实现的、可扩展的、一种相对比较完善的捕捉数据质量事件,同时对其进行量度和控制的方法。  本文提供一个在数据仓库项目的实施过程中,可增量添加的、可扩展的数据质量体系结构,它可以

2011-09-06 17:46:29 780

原创 数据仓库建设持续改进数据质量

从实施中国电信6省营销分析情况来看,数据质量改进普遍存在如何定义数据质量评价标准、如何实现数据质量管理的闭环过程、如何界定数据质量改进过程中各系统间的功能边界三个难点问题。数据质量改进案例分析从实施中国电信6省营销分析情况来看,数据质量改进普遍存在如何定义数据质量评价标准

2011-09-06 17:44:55 530

原创 talend网址

http://cn.talend.com/index.php 中文网址http://www.talend.com/index.php 英文网址数据质量:http://cn.talend.com/products-data-quality/index.php

2011-09-06 17:34:35 516

原创 名词解释

fc5 :基于linux的操作系统  全称: federo5

2011-09-06 14:14:26 265

原创 MyEclipse 配置 Hadoop 插件

1、找到Hadoop Eclipse Plugin 插件 jar包具体插件的位置如下:..\hadoop-0.21.0\mapred\contrib\eclipse-plugin\hadoop-0.21.0-eclipse-plugin.jar找到该插件之后,复制

2011-09-06 14:09:32 266

原创 jQuery网址

http://jqapi.com/

2011-09-06 14:06:05 217

原创 win7删除服务的方法

services.msc 打开服务regedit打开注册表HKEY_CURRENT_USERHKEY-LOCAL-MACHINE SYSTEMCONTROLSET servicesHKEY-USERSHKEY-CURRENT

2011-09-06 14:04:45 241

转载 Cygwin上的服务

目录]content(Created by TxtBrowser)    1. cygrunsrv程序    2. inetd服务:    .   2.1 cvspserver服务    .       2.1.1 在本地安装cvs    .

2011-09-06 13:58:40 2000

原创 hadoop eclipse插件位置

https://issues.apache.org/jira/browse/MAPREDUCE-1280  3.4版本的插件3.3的在jar包中。

2011-09-06 12:18:00 253

原创 hadoop资料官方位置

http://hadoop.apache.org/common/docs/r0.20.2/cn/hadoop 官网 http://hadoop.apache.org/点击common 到达http://hadoop.apache.org/common/选择文档下面的R

2011-09-06 12:16:16 192

原创 收录软件名称

收录软件名称 稞麦综合视频下载 下载视频

2011-09-06 12:09:02 199

原创 黄亭子

海淀区 石景山区 丰台区  门头沟区  西城区 黄亭子公交站:21 40 209夜班车  212夜班车  320  320区   414 1 1快  65 68 78 99 308 337 728

2011-09-06 12:08:21 2311

转载 it网

http://www.oschina.net/ 开源中国社区http://www.opensourceforce.org 开源力量

2011-09-06 12:06:52 199

原创 泡妞第一课

因为打情骂俏的时候,往往是在“揭露”女生的缺点。比如骂她懒,骂她馋嘴,骂她好色,骂她贪财等。当你用一种玩笑的语气去揭露她的缺点,她能感觉到你对她缺点的接受和包容。所有人都希望别人喜欢他是喜欢他的全部,不仅他的优点,还有他的缺点。当你夸一个人的优点,说因为这个优点而喜欢他,他就很有

2011-09-06 12:06:02 251

原创 主数据管理(MDM)与元数据管理

主数据(Master Data)和元数据(Meta Data)是两个完全不同的概念。元数据是指表示数据的相关信息,比如数据定义等,而主数据是指实例数据,比如产品目录信息等。比如,某省地税开发了一套征收管理软件,以市为单位部署了17套,每套征收管理软件中的元数据都是一样的,但是主数

2011-09-06 12:04:25 951

原创 bi

数据库数据仓库dw:data warehouse:数据仓库是一个过程而不是一个项目 信息的汇总,需要有元数据 ,智能定期插入,查询数据清洗,转换 装载 查询展示查询报表:报表系统就是信息,可以看做低端bi数据分析:数据挖掘:数据备份:数据恢复:商业

2011-09-06 12:01:06 237

原创 数据质量的问题及解决方法

数据质量的问题:典型的有数据遗漏、数据错误、多义字段、矛盾值、违背业务规则、主键重复、无法关联、没有意义的默认值等问题是如何产生:管理因素:各个部门独立设计自己的应用系统,业务定义相互冲突。                           系统因素:例如某些应用程序测

2011-09-06 12:00:50 1460

原创 hadoop总结

hadoop总结http://blog.csdn.net/wansheg/article/details/1780340 hadoop 的RMI实现分析。(请参考hadoop RMI 的源码) http://www.cnblogs.com/wayne1017/arch

2011-09-06 11:58:14 260

原创 hadoop2.0网址列表

hadoop2.0网址列表 http://hadoop.apache.org/common/docs/r0.20.2/http://hadoop.apache.org/common/docs/r0.20.2/cn为最新中文文档。

2011-09-06 11:57:29 227

原创 hadoop1.9网址列表

hadoop1.9网址列表

2011-09-06 11:57:13 192

转载 企业如何保证数据质量

解决数据仓库中的数据质量问题需要技术手段,也需要管理手段,还需要决策层给予充分的支持,从而在技术与业务互动中逐步解决数据质量问题。 企业信息化的浪潮正如火如荼,电信、金融、石化等大型企业迫于市场竞争压力纷纷实施数据仓库项目来提升竞争力。数据仓库项目实施的难题之一就是企业的数据

2011-09-06 11:53:38 989

原创 bi商业智能软件

软件分成纵横四个层次的的象限图来表达!     第一维度:数据存储层——>数据报表层——>数据分析层——>数据展现层     第二维度:用户级——>部门级——>企业级——>BI级报表层 :Crystal Report水晶报表,Bill报表,这都是全球最流行

2011-09-06 11:53:22 490

原创 数据质量

数据质量的含义:数据准确性 合法性一致性,完整性,唯一性,一致性:统一数据来源,精准度,合法性(格式,类型) 及时性相关软件: DataCleaner DataCleaner 是一个数据质量分析,比较,验证和监督的软件Talend Open Profiler 开源

2011-09-06 11:50:28 610

原创 良好开发习惯

1文件存储及包的组织:开发文档资料、数据库相关  、登陆相关、  开发流程及进度汇总、开发源码、开发数据表、开发总结2开发过程:0建立存储包结构1先看文档2写开发流程3按照开发流程开发4写开发总结

2011-09-06 11:35:24 257

原创 计算机分类:

计算机分类:按照运算速度分:巨型机 大型机 小型机 工作站 微型机按照处理的数据类型:模拟计算机  数字计算机 混合计算机微型机已经应用于办公自动化、数据库管理、图像识别、语音识别、专家系统,多媒体技术等领域微机操作系统:dos  window   、mac os

2011-09-06 11:27:43 269

原创 虚拟机下操作系统安装

1下载工具:虚拟机 虚拟光驱  操作系统软件类型软件名英文名虚拟机VirtualBoxOracle VM VirtualBox操作系统redhat操作系统

2011-09-06 09:53:46 544 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除