2.商业问题和数据科学解决方案
基本概念:一系列数据挖掘任务
主要工具:数据挖掘过程;有监督和无监督数据挖掘
从商业问题到数据挖掘任务
监督VS非监督理论
数据挖掘和其结果
数据挖掘过程
业务理解
数据准备
建模
评估
部署
管理数据科学团队的内涵
其他分析技术和技巧
统计
数据库查询
数据仓库
回归分析
机器学习和数据挖掘
用这些技巧回答业务问题
总结
第二章 商务问题和数据科学解法
基本概念:一套权威数据分析任务;数据挖掘过程;监督和非监督数据挖掘
一个重要的数据科学原则就是数据挖掘是一个有着十分好理解的阶段的过程。一些人参与信息技术的应用,比如自动发现和评估从数据中找到的模式,而其他人大多数需要一个分析师的创造力,业务知识和常识。理解这整个过程帮我们很好的构建一个数据挖掘项目,所以这接近系统分析而不是靠基于和个人敏锐驱动的英雄般的努力。
但是也要注意,以上所说的系统分析过程更像是次发过程,始发过程是最需要创造力的。也是最需要个人英雄的。通常,创造都是有个人点发的,而不是集体。因此,尊重和欣赏个性也同样重要。这就是阴阳思维,道的思维。系统工程。
**
我想起了以前看过的关于钱学森,马斯克和乔布斯的访谈,他们是人们心中的英雄,但是他们全都谈到了一点,就是人们喜欢偶像,喜欢英雄,所以他们更爱关心英雄本身的传奇,而不是整个团队。无论是东风火箭,猎鹰九号,还是苹果手机,都是团队协作的系统工程。
我以前也是过与关注个人英雄,而忽视了这个系统。
在知识技能高度分化的今天,要想有所成就,必须懂得合作的重要,让合作精神渗入骨髓,并且要掌握合作的技能,例如语言沟通。
但这并不意味着否定个人英雄,真正好的团队,是人人都是各自分内的英雄。人尽其才,物尽其用。
**
从商务问题到数据挖掘任务
任何一个问题都是独一无二的,它包含了目标和约束的组合。拿流失问题说,对于MEGA来说,和对其