基于python的数据挖掘报告_Python数据挖掘——数据挖掘概况

数据挖掘是从海量数据中挖掘未知且有价值信息的过程,涵盖了统计学、数据可视化、机器学习等多个领域。它与数据分析主要区别在于作用和方法,解决分类、聚类、关联和预测等问题。常见的数据挖掘算法包括决策树、神经网络、K均值等。数据挖掘流程遵循CRISP-DM方法论,涉及商业理解、数据理解、数据准备、模型构建、模型评估和模型部署等阶段。
摘要由CSDN通过智能技术生成

数据挖掘概况

什么是数据挖掘?

数据挖掘(Data mining,简称DM),是指从大量数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。

数据挖掘是一门交叉学科,覆盖了统计学、数据可视化、算法、数据库、机器学习、市场营销和其他学科等知识。

数据挖掘与数据分析的区别:

项目

数据分析

数据挖掘

定义

根据分析目的,用适当的方法即工具,对收集的数据进行处理与分析,提取有价值的信息,发挥数据的作用

从大量数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。

作用

现状分析、原因分析、预测分析

解决四类问题:分类、据类、关联、预测

方法

对比分析、分组分析、交叉分析、回归分析等

决策树、神经网络、关联规则、据类分析等

结果

指标统计量结果,如综合/平均值等

输出模型或规则

模型:定量模型:数学公式(Y=a*X) ; 定性模型:规则(年龄>30岁 and 收入> 1万元)

算法:实现数据挖掘技术、模型的具体步骤与方法。(最小二乘法、K均值法等)

数据挖掘常见问题:用户流失预测(分类)、促销活动响应(分类)、目标市场细分(聚类)、交叉销售提升(关联)、未来显示预测(预测)

分类问题:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值