![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库/数据库
文章平均质量分 84
羽翼天宇
机会永远是留给有准备的人的,每天都要不断的有所进步,越努力,越幸运
展开
-
官方教程:Apache Kylin和Superset集成,使用开源组件,完美打造OLAP系统
本文转自Apache Kylin公众号apachekylin.Superset 是一个数据探索和可视化平台,设计用来提供直观的,可视化的,交互式的分析体验。Superset 提供了两种分析数据源的方式:1. 用户可以以单表形式直接查询多种数据源,包括 Presto、Hive、Impala、SparkSQL、MySQL、Postgres、Oracle、Redshift、SQL Serve...原创 2018-07-29 14:53:22 · 416 阅读 · 0 评论 -
从数据仓库到大数据,数据平台这25年是怎样进化的?
从数据仓库到大数据,数据平台这25年是怎样进化的?从「数据仓库」一词到现在的「大数据」,中间经历了太多的知识、架构模式的演进与变革。数据平台这25年究竟是怎样进化的?让InfoQ特约老司机为你讲解。我是从2000年开始接触数据仓库,大约08年开始进入互联网行业。很多从传统企业数据平台转到互联网同学是否有感觉:非互联网企业、互联网企业的数据平台所面向用户群体是不同的。那么,这两类的数据平...原创 2018-07-29 15:18:20 · 1214 阅读 · 0 评论 -
一个母婴电子商务网站贝贝网的大数据平台及机器学习实践
一个母婴电子商务网站贝贝网的大数据平台及机器学习实践 关键字:大数据平台、机器学习贝贝网的主要产品是垂直的母婴类,母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当中,关心的是孕妈的一些问题,几个月以后,随着宝宝的落地,就会准备一些纸尿...原创 2018-07-29 15:20:37 · 995 阅读 · 0 评论 -
机器学习中的数据清洗与特征处理
机器学习中的数据清洗与特征处理注:本文转载自 https://tech.meituan.com/machinelearning-data-feature-process.html综述如上图所示是一个经典的机器学习问题框架图。数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗=>特征,标注数据生成=>模型学习=>模型应用”中的前两个步骤。灰色框中蓝色箭头...原创 2018-07-29 14:59:24 · 2088 阅读 · 0 评论 -
大数据分析界的“神兽”Apache Kylin有多牛?
大数据分析界的“神兽”Apache Kylin有多牛? 本文作者:李栋,来自Kyligence公司,也是Apache Kylin Committer & PMC member,在加入Kyligence之前曾就职于eBay、微软。1.Apache Kylin是什么? 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Table...原创 2018-07-29 15:11:50 · 133 阅读 · 0 评论