数据分析和数据挖掘有什么区别

大数据分析关注趋势,数据挖掘则聚焦问题发现。数据挖掘流程包括数据产生、预处理、建模等步骤。数据分析侧重业务知识,而数据挖掘更注重技术实现,需要大量数据和技术能力,其结果是用于预测的模型。
摘要由CSDN通过智能技术生成

  大数据是互联网上海量的数据挖掘,而数据挖掘更多的是针对企业内部的小数据挖掘,数据分析是进行有针对性的分析和诊断,大数据需要分析的是趋势和发展趋势,数据挖掘主要是发现问题和诊断。

 

  数据挖掘流程包含哪些步骤

 

  一、数据的产生

 

  很多时候我们会发现在浏览网站或者app时总会给我们推荐一些与我们相关的信息,这其实就是根据我们的互联网行为来进行预测的,前端获取到用户的行为数据,传输到后端,然后存储到服务器上,具体行为如下:

 

  浏览网页时或者app时,你的点击和停留行为都会被服务器所记录,终存储到数据库上

 

  浏览购物app时,你的订单,添加购物车,收藏,关注等行为

 

  浏览快手,抖音等洗脑app时,你的关注,停留,评论,点赞,转发等行为都会被记录在服务器上

 

  二、数据预处理

 

  预处理就是提前处理一下,当把数据从源中读取出来之后,我们可能会发现有些数据不符合我们的要求,比如有缺失值或者异常值(年龄为0),我们的处理可能是删除,也可能是填充,我们把这些脏数据整理成干净的数据。除此之外,我们可能还需要进行数据的变换,把原始数据转化成符合模型要求的数据。

 

  三、数据建模

 

  数据清洗完了之后,进行可视化展示,然后我们使用一条线去拟合这些点,这条线就是一个函数,有了这个函数我们就可以进行预测,这个函数就是一个模型,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值