分布式数据分析与挖掘系统及算法实战

最新推荐文章于 2019-04-18 11:19:32 发布

gaokeke

最新推荐文章于 2019-04-18 11:19:32 发布

阅读量566

点赞数

为什么把数据挖掘和数据分析放在一起说？是因为数据挖掘本身是一个数据应用化的过程，而应用化的过程某种意义上就是一个数据分析的过程，而这个数据分析可以是人为定义的、AI人工智能辅助的等等。所以，数据挖掘和数据分析的关系：通过不断优化的数据分析方法，并利用数据挖掘才能够得出数据应用价值的最大化的结果。

本次数据库技术大会,我们有幸邀请到了来自华为、去哪儿、联想、平安科技等大型互联网公司的技术专家为我们带来数据挖掘与数据分析方面的技术分享。

专场10：数据分析与挖掘

5月12日下午，我们特设了专场10：数据分析与挖掘，主要就分布式数据分析与挖掘系统及算法实战、从制造到智造——大数据驱动下的制造业发展、基于GoldenGate产品的实时数据同步平台架构演进、智慧社保解决方案：社保大数据的分析与挖掘实践、去哪儿酒店大数据建设实践、扩展Spark引擎支持MPP计算场景替换大规模企业级传统数据仓库等6个议题展开讨论与分享。

2017第八届中国数据库技术大会（DTCC2017）将于2017年5月11-13日，历时3天，汇集来自互联网、电子商务、金融、电信、政府、行业协会等20多个领域的120多位技术专家，共同探讨Oracle、MySQL、NoSQL、云端数据库、智能数据平台、区块链、数据可视化、深度学习等领域的前瞻性热点话题与技术。

大会共设定2大主场和21个技术专场，将吸引5000多名IT人士参会，为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。

专场10：数据分析与挖掘

5月12日下午13:30-18:00

涂丹丹

华为分布式算法实验室负责人

分布式数据分析与挖掘系统及算法实战

5月12日下午13:30-14:10

演讲简介：

随着现实世界中数据呈指数级增长，大规模数据分析和挖掘效率提升迫在眉睫。数据分析挖掘系统和算法的分布式并行可扩展是提升大规模数据分析与挖掘的效率的基础，面临巨大挑战。本次演讲主要介绍华为大数据分析与挖掘系统架构和算法框架的演进，揭秘数据分析与挖掘系统及算法框架的分布式并行核心架构，共同探讨华为大数据分析与挖掘系统和算法框架的产品化之路。

符鹏飞

北京永洪商智科技有限公司咨询部总监

从制造到智造——大数据驱动下的制造业发展

5月12日下午14:10-14:50

演讲简介：

无论是政府还是企业，过去在IT信息建设过程中，主要以基础平台的搭建为主，基本上如数据仓库、数据中心、大数据平台等均已搭建完成，但是在数据应用还是非常缺乏。那么如何才能让数据发挥更大的数据价值，如何才能在基础平台的基础之上构建出百花齐放，人人可用的数据分析应用平台，如何才能将基础平台的价值最大化？本次报告将深入思考困境的本质，深入剖析目前行业数据分析应用的现状，从而从核心技术和分析应用上找到最佳解决方案。

杜灵强

平安科技数据集成平台分组经理

基于GoldenGate产品的实时数据同步平台架构演进

5月12日下午14:50-15:30

演讲简介：

在社会保险领域,涵盖参保，待遇享受，医疗，用药等多方面的业务，数据已经比较丰富，但在数据的整合、分析、挖掘方面还有所欠缺，特别是近年来，随着社保覆盖面的增大，由于在参保人员管理、财务管理、基金管理方面缺乏精细化管理，导致医保盗刷，重复支付，冒领养老金等现象时有发生，因此对社保管理提出来更高的要求。我们一直在探索如何使用大数据，进行社保业务审计稽查，发现业务漏洞，和潜在风险，提升社保综合管理服务能力，同时也在沉淀社保的业务场景，业务规则库，形成社保大数据的整体解决方案，以及实现产品化输出。

闵佳(花名:申杭)

袋鼠云大数据首席架构师

智慧社保解决方案：社保大数据的分析与挖掘实践

5月12日下午15:50-16:30

演讲简介：

胡智

去哪儿网大住宿事业部数据中心负责人

去哪儿酒店大数据建设实践

5月12日下午16:30~17:10

演讲简介：

主要是关于多数据部门合并背景下的数据治理、仓库建设、架构设计以及提供的数据服务做一些介绍和探讨数据治理介绍统一的埋点方案、数据收集框架和数据字典建设，以及对元数据的管理仓库建设从人员设置、结构设计和架构等方面介绍数据中心重构数据仓库的相关经验和教训架构设计从整体上介绍我们的大数据解决方案和技术选型数据服务分别介绍我们面对的不同需求方提供的不同服务，包括销售端、供应链端数据系统、产品运营使用的报表系统以及数据接口服务和算法模型服务.

张成松

联想大数据研发总监

扩展Spark引擎支持MPP计算场景替换大规模企业级传统数据仓库

5月12日下午17:10~17:50

演讲简介：

在传统企业有大量的Oracle、SQL server、DB2、Mysql等关系型数据库，在其业务系统中，有大量的CRUD和存储过程使用场景。随着业务数据增多，这些关系型数据库，很难满足业务日常使用要求。如何为这些传统关系型数据库，提供一个更高效的大数据平台，如何快速、平滑的将这些旧的业务，迁移到导数据平台上，已经成为传统企业技术转型迫切需要解决的问题。本topic讲述了扩展Spark引擎以支持MPP计算场景的方案，以便替换大规模企业的传统数据仓库等。

5月12日大会议程预告

扫码查看，大会3天完整议程

gaokeke

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式数据分析与挖掘系统及算法实战

为什么把数据挖掘和数据分析放在一起说？是因为数据挖掘本身是一个数据应用化的过程，而应用化的过程某种意义上就是一个数据分析的过程，而这个数据分析可以是人为定义的、AI人工智能辅助的等等。所...
复制链接

扫一扫