学习笔记 Data Science for Business 第二章

本文探讨了如何将数据科学应用于商业问题,强调了数据挖掘任务如分类、回归、聚类在解决问题中的作用。区分了监督式和非监督式方法,并以电信公司的客户流失问题为例,说明数据挖掘建立预测模型的过程。此外,还提到了数据挖掘的迭代过程(CRISP-DM)和管理数据科学团队的特性,以及统计学、数据库查询等其他分析技术在解决商业问题上的应用。
摘要由CSDN通过智能技术生成

商业领域的问题以及数据科学之对策

1. 从商业问题数据挖掘任务

任何一个“由数据驱动的”商业决策问题,尽管都有其行业或者应用的独特性,但是解决这个问题的办法却依赖于若干个基本的数据挖掘任务。这些任务列举如下:

  1. 分类以及类的概率预测(classification & class probability estimation)
  2. 回归(regression)
  3. 相似性匹配(similarity matching)
  4. 聚类(clustering)
  5. 并存分组(co-occurrence grouping)
  6. 概述(profiling)
  7. 联系预测(link prediction)
  8. 数据简化(data reduction)
  9. 因果模型(causal modelling)

2. 监督式和非监督式方法

监督式和非监督这两个术语,来自于机器学习领域。这是一种比喻:老师利用一系列的例子(samples),通过提供“目标信息(target information)”,从而“监督”学习者。比如,老师通过提供大量的练习题(samples),并且提供正确的答案(target information)࿰

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值