本文目录
写在前面
《数据挖掘与大数据分析》是学校为大二计科学生安排的一门前沿技术入门课程
这门课程在学长们那里有非常好的口碑 我也感觉这是很有意义的一门课程!
所以——
我开始每节课进行课堂笔记的记录并且查询一些课程相关的的知识点
一并记录在文章中
1.为了让自己更好地上好这门宝贵的课程
2.也是为了分享给大家 大家一起学习 互相监督~
对数据挖掘这方面感兴趣的小伙伴 快来一起学习嗷~
冲哦!
整装待发
0.初步了解大数据 数据分析 数据挖掘
大数据是互联网的海量数据挖掘 需要分析的是趋势和发展
数据分析就是进行做出针对性的分析和诊断
数据挖掘更多是针对内部企业行业小众化的数据挖掘 主要发现的是问题和诊断
0.1 大数据(big data)
1.大数据(名词)指:
无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
2.在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指:
不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。
3.大数据的5V特点(IBM提出):
Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)
0.2 数据分析
1.数据分析(动词)是指:
用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
2.在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
3.数据分析的数学基础在20世纪早期就已确立ÿ