《大数据之路:阿里巴巴大数据实践》系列丛书
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
第14章 存储和成本管理
本文介绍了阿里巴巴大数据实践中的数据挖掘技术,包括数据挖掘概述、算法平台和中台体系。数据挖掘中台包含特征层、中间层和应用层,旨在提升效率和资源共享。算法平台基于MaxCompute MPI,集成多种机器学习算法。文中还探讨了用户画像和互联网反作弊的案例,展示了数据挖掘在实际业务中的应用。
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
第14章 存储和成本管理
3319
603
1629
210

被折叠的 条评论
为什么被折叠?