从零开始学python数据分析与挖掘第1章学习笔记

第1章 数据分析与挖掘概述

1.1 什么是数据分析和挖掘

 数据来源:

  • 问卷调查法
  • 实验法
  • 通过设备记录数据
  • 通过网页或APP记录用户操作
  • 通过数据接口、网络爬虫获得公开数据
  • 企业数据共享

数据分析与挖掘目的都是基于搜集到的数据,应用数学、统计、计算机等技术抽取出数据中的有用信息,进而为决策提供依据和指导方向。

1.3 数据分析与挖掘的区别

从广义来说,数据分析涵盖了数据分析和数据挖掘两个部分。

从狭义来说,两者有差异。

1、从定义说明出发:

数据分析采用适当的统计学方法,对搜集来的数据进行描述性分析和探索性分析,病从中发现数据背后的价值;二数据分析则用数据库知识、统计学、机器学习、人工智能等方法,对数据发掘,发现其中未知的规律和有用知识。

2、从侧重点出发:

数据分析更侧重实际的业务知识,数据与业务紧密结合,实现功效最大;数据挖掘更侧重技术的实现,对业务熟练度有更高的要求。

3、从掌握的技术出发:

数据分析一般要求具备基本的统计学知识、数据库操作、excel报告操作等能力;数据挖掘对数学功底和编程有更高的要求。

4、从输出的结果出发:

数据分析更多的是描述统计结果的呈现,如果平均水平、总体趋势、差异对比等,结果必须结合业务知识解读;数据挖掘更多的是模型或规则的输出,通过模型或规则棵对未知标签的数据进行预测。

可以整理成表格。

1.4 数据挖掘的流程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值