大数据分析与建模部分一-核心概念汇总

本文是数据科学专业学生对大数据分析与建模课程核心概念的总结,涵盖大数据的4V特征、数据挖掘、机器学习与数据挖掘的关系、监督与无监督学习、分类聚类、估计预测等内容,旨在分享学习心得。
摘要由CSDN通过智能技术生成

笔者是一个数据科学专业的本科生,这段时间学习了核心课程的数据分析与建模,汇总了一些考试的核心概念,分享到此

1.大数据的定义和4V特征

大数据泛指无法在可容忍的时间内用传统的理论,方法和技术以及软硬件工具对其进行获取,管理和分析的巨量数据集合,包含4V特性:variety(多样性)value(价值低)volume(容量大)velocity(速度快)

2.大数据存在的三个问题

海量数据与分析处理实时性的之间的矛盾
数据来源,数据种类和数据存储之间的矛盾
传统数据管理和大数据管理模式之间的矛盾

3.数据挖掘的概念

数据挖掘是指从数据库大量数据中解释处隐含的,先前未知的并有潜在价值的信息的非平凡过程,主要采用机器学习,人工智能,数据库处理,概率统计学,数据可视化的一些知识,高度自动化的分析数据,作出归纳性的推理,数据挖掘的和行任务是对数据特征和关系进行探索,建立。根据数据的特征可以将数据挖掘的功能分为两大类,有指导的学习和无指导的学习,通过学习,建立模型,实现分类,估计和预测三方面的功能
(判断题✅)概率统计是数据挖掘使用的一种方法,但是概率统计不等同与数据挖掘,数据挖掘可以使用机器学习,人工智能的一系列方法。

4.机器学习和数据挖掘的关系

机器学习是一门偏向理论性学科,采用大量的统计学知识,通过数据训

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值