- 博客(39)
- 收藏
- 关注
转载 全球最佳15个免费云存储服务推荐
据国外媒体报道,对一般用户来说,除非需要1TB以上超大容量存储空间,很少人愿意付费获得一个云存储。其实有很多云存储厂商,都会提供一些小容量的免费云存储给一般用户,对只需要存储一些照片、文档的用户来说,5GB、10GB容量足矣。不用再花钱扩容存储卡,以下15个小容量免费存储服务推荐
2011-09-19 16:20:47 4071
原创 linux网址大全
linux网址大全 1Virtuabox 虚拟机克隆方法http://www.cnblogs.com/foxhengxing/archive/2010/09/10/1822899.html2jdk安装:http://blog.163.com/zjc_8886/blog
2011-09-13 16:38:32 290
原创 hadoop总结2
http://blog.csdn.net/lmc_wy/article/details/6035543 Hadoop 0.20.2 集群配置ubuntu10.10http://blog.csdn.net/yanical/article/details/4474830 Wind
2011-09-08 12:03:42 196
原创 网页地址分享工具
http://www.jiathis.com/help/html/what-is-jiathis jiathishttp://www.passit.cn/bookmark.html passithttp://share.baidu.
2011-09-07 17:52:25 421
原创 程序员常去地网址
1 J2me开发网 http://www.j2medev.com/bbs/index.asp2 J2me社区 http://www.j2meforums.com/forum/3 csdn http://www.csdn.net/4 Vc知识库 http://www.v
2011-09-07 15:33:12 287
转载 oracle warehouse builder 在ETL 中的数据质量控制
参考网址:http://database.ctocio.com.cn/tips/265/7419765.shtmlETL是非常重要的一步,往往一个项目的成败就是看ETL过程的成功与否.选用一个好的ETL工具会让项目更加的有信心 数据质量一直是ETL工具的一个
2011-09-06 20:37:08 705
原创 Kettle 与 Talend Open Studio 的 ETL 比较
原文地址:http://my.oschina.net/ychenIntegration/blog/23807 Pentaho Data Integration (Kettle)是Pentaho生态零碎中默许的ETL对象。经过十分直不雅的图形化编纂器(Spoon),您可以界说以XM
2011-09-06 20:26:29 2380
原创 talend+教程网址
http://www.talendforge.org/tutorials/menu.php?src=HomepageSpecial talend 教程网址http://www.talendforge.org/ 点击tutorials 选择data quality
2011-09-06 20:16:13 3943
原创 Pentaho
Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。功能和特
2011-09-06 19:48:32 460
原创 hadoop结构说明
Hadoop的结构:pDFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员只要用较少的代码就可以完成分布式程序的开发,这使得开发人员只需要关注业务逻辑的即可Hadoop 是Apache
2011-09-06 17:56:17 440
原创 hadoop开发环境搭建
Hadoop分布式的好处:DFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员只要用较少的代码就可以完成分布式程序的开发,这使得开发人员只需要关注业务逻辑的即可Hadoop的windo
2011-09-06 17:50:33 650
原创 hadoop收集
Hadoop核心项目提供了在低端硬件上构建云计算环境的基础服务,它也提供了运行在这个云中的软件所必须的API接口。Hadoop内核的两个基本部分是MapReduce框架,也就是云计算环境,和Hadoop分布式文件系统 (HDFS)。Hadoop核心MapReduce框架需要一
2011-09-06 17:48:44 290
原创 数据质量体系结构介绍
数据质量管理过程是一个没有终点的过程,也没有统一架构原则。这里提供的是一种针对数据仓库项目可以简单实现的、可扩展的、一种相对比较完善的捕捉数据质量事件,同时对其进行量度和控制的方法。 本文提供一个在数据仓库项目的实施过程中,可增量添加的、可扩展的数据质量体系结构,它可以
2011-09-06 17:46:29 822
原创 数据仓库建设持续改进数据质量
从实施中国电信6省营销分析情况来看,数据质量改进普遍存在如何定义数据质量评价标准、如何实现数据质量管理的闭环过程、如何界定数据质量改进过程中各系统间的功能边界三个难点问题。数据质量改进案例分析从实施中国电信6省营销分析情况来看,数据质量改进普遍存在如何定义数据质量评价标准
2011-09-06 17:44:55 547
原创 talend网址
http://cn.talend.com/index.php 中文网址http://www.talend.com/index.php 英文网址数据质量:http://cn.talend.com/products-data-quality/index.php
2011-09-06 17:34:35 547
原创 MyEclipse 配置 Hadoop 插件
1、找到Hadoop Eclipse Plugin 插件 jar包具体插件的位置如下:..\hadoop-0.21.0\mapred\contrib\eclipse-plugin\hadoop-0.21.0-eclipse-plugin.jar找到该插件之后,复制
2011-09-06 14:09:32 281
原创 win7删除服务的方法
services.msc 打开服务regedit打开注册表HKEY_CURRENT_USERHKEY-LOCAL-MACHINE SYSTEMCONTROLSET servicesHKEY-USERSHKEY-CURRENT
2011-09-06 14:04:45 267
转载 Cygwin上的服务
目录]content(Created by TxtBrowser) 1. cygrunsrv程序 2. inetd服务: . 2.1 cvspserver服务 . 2.1.1 在本地安装cvs .
2011-09-06 13:58:40 2305
原创 hadoop eclipse插件位置
https://issues.apache.org/jira/browse/MAPREDUCE-1280 3.4版本的插件3.3的在jar包中。
2011-09-06 12:18:00 261
原创 hadoop资料官方位置
http://hadoop.apache.org/common/docs/r0.20.2/cn/hadoop 官网 http://hadoop.apache.org/点击common 到达http://hadoop.apache.org/common/选择文档下面的R
2011-09-06 12:16:16 204
原创 黄亭子
海淀区 石景山区 丰台区 门头沟区 西城区 黄亭子公交站:21 40 209夜班车 212夜班车 320 320区 414 1 1快 65 68 78 99 308 337 728
2011-09-06 12:08:21 2314
原创 泡妞第一课
因为打情骂俏的时候,往往是在“揭露”女生的缺点。比如骂她懒,骂她馋嘴,骂她好色,骂她贪财等。当你用一种玩笑的语气去揭露她的缺点,她能感觉到你对她缺点的接受和包容。所有人都希望别人喜欢他是喜欢他的全部,不仅他的优点,还有他的缺点。当你夸一个人的优点,说因为这个优点而喜欢他,他就很有
2011-09-06 12:06:02 263
原创 主数据管理(MDM)与元数据管理
主数据(Master Data)和元数据(Meta Data)是两个完全不同的概念。元数据是指表示数据的相关信息,比如数据定义等,而主数据是指实例数据,比如产品目录信息等。比如,某省地税开发了一套征收管理软件,以市为单位部署了17套,每套征收管理软件中的元数据都是一样的,但是主数
2011-09-06 12:04:25 970
原创 bi
数据库数据仓库dw:data warehouse:数据仓库是一个过程而不是一个项目 信息的汇总,需要有元数据 ,智能定期插入,查询数据清洗,转换 装载 查询展示查询报表:报表系统就是信息,可以看做低端bi数据分析:数据挖掘:数据备份:数据恢复:商业
2011-09-06 12:01:06 256
原创 数据质量的问题及解决方法
数据质量的问题:典型的有数据遗漏、数据错误、多义字段、矛盾值、违背业务规则、主键重复、无法关联、没有意义的默认值等问题是如何产生:管理因素:各个部门独立设计自己的应用系统,业务定义相互冲突。 系统因素:例如某些应用程序测
2011-09-06 12:00:50 1589
原创 hadoop总结
hadoop总结http://blog.csdn.net/wansheg/article/details/1780340 hadoop 的RMI实现分析。(请参考hadoop RMI 的源码) http://www.cnblogs.com/wayne1017/arch
2011-09-06 11:58:14 264
原创 hadoop2.0网址列表
hadoop2.0网址列表 http://hadoop.apache.org/common/docs/r0.20.2/http://hadoop.apache.org/common/docs/r0.20.2/cn为最新中文文档。
2011-09-06 11:57:29 258
转载 企业如何保证数据质量
解决数据仓库中的数据质量问题需要技术手段,也需要管理手段,还需要决策层给予充分的支持,从而在技术与业务互动中逐步解决数据质量问题。 企业信息化的浪潮正如火如荼,电信、金融、石化等大型企业迫于市场竞争压力纷纷实施数据仓库项目来提升竞争力。数据仓库项目实施的难题之一就是企业的数据
2011-09-06 11:53:38 1006
原创 bi商业智能软件
软件分成纵横四个层次的的象限图来表达! 第一维度:数据存储层——>数据报表层——>数据分析层——>数据展现层 第二维度:用户级——>部门级——>企业级——>BI级报表层 :Crystal Report水晶报表,Bill报表,这都是全球最流行
2011-09-06 11:53:22 503
原创 数据质量
数据质量的含义:数据准确性 合法性一致性,完整性,唯一性,一致性:统一数据来源,精准度,合法性(格式,类型) 及时性相关软件: DataCleaner DataCleaner 是一个数据质量分析,比较,验证和监督的软件Talend Open Profiler 开源
2011-09-06 11:50:28 642
原创 良好开发习惯
1文件存储及包的组织:开发文档资料、数据库相关 、登陆相关、 开发流程及进度汇总、开发源码、开发数据表、开发总结2开发过程:0建立存储包结构1先看文档2写开发流程3按照开发流程开发4写开发总结
2011-09-06 11:35:24 292
原创 计算机分类:
计算机分类:按照运算速度分:巨型机 大型机 小型机 工作站 微型机按照处理的数据类型:模拟计算机 数字计算机 混合计算机微型机已经应用于办公自动化、数据库管理、图像识别、语音识别、专家系统,多媒体技术等领域微机操作系统:dos window 、mac os
2011-09-06 11:27:43 275
原创 虚拟机下操作系统安装
1下载工具:虚拟机 虚拟光驱 操作系统软件类型软件名英文名虚拟机VirtualBoxOracle VM VirtualBox操作系统redhat操作系统
2011-09-06 09:53:46 593 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人