![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据基础
fall_hat
这个作者很懒,什么都没留下…
展开
-
Kettle windows安装及运行spoon.bat时Kettle无法启动问题解决
下载kettlehttps://sourceforge.net/projects/pentaho/files/Data%20Integration/解压运行 spoon.bat如果启动不了,dos界面一闪而过,则修改spoon.batif "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024" "-Xmx2048m" "-XX:MaxPermSize=256m"改为if "%PENTAHO_DI_JAV.原创 2020-06-09 16:01:24 · 4310 阅读 · 4 评论 -
数据仓库的一些概念
https://www.jianshu.com/p/8da8968c3a09原创 2020-05-25 15:01:32 · 121 阅读 · 0 评论 -
明明白白的etl工具-kettle
kettle原创 2020-03-02 17:21:54 · 245 阅读 · 0 评论 -
明明白白的CentOS 7 中配置 Hadoop 3.1.2 完全分布式
https://juejin.im/post/5c9643c05188252d805c77fa原创 2020-01-02 22:57:11 · 107 阅读 · 0 评论 -
hanlp提高自定义词典优先级
Segment shortestSegment = new NShortSegment().enableCustomDictionary(true).enableCustomDictionaryForcing(true).enablePlaceRecognize(true).enableOrganizationRecognize(true);List<Term> termList =...原创 2019-11-15 09:46:22 · 1982 阅读 · 0 评论 -
ETL和ELT简述
ETLETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。ETL在转化的过...原创 2019-10-25 09:55:04 · 1924 阅读 · 0 评论 -
oltp和olap的区别
联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analyti...原创 2019-10-25 09:49:42 · 102 阅读 · 0 评论