文章目录
作业内容
在完成其中与数学关系比较紧密的几题(5 6题)感觉还是很生疏(太久没做数学题了)。
想搞人工智能 要加强数学的应用呐。。
#1.什么是数据挖掘?
第一节课结束后 对数据挖掘的定义还存有一丝疑惑 所以在CSDN总结了——《数据挖掘背景知识2——数据挖掘可以做到什么 带给我们什么?》这篇文章
其中一部分恰好吻合了作业内容——
数据挖掘的定义
数据挖掘(Data Mining)是指通过大量数据集进行分类的自动化过程,以通过数据分析来识别趋势和模式,建立关系来解决业务问题。
换句话说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
数据挖掘与数据分析的区别
数据分析和数据挖掘都是从数据库中发现知识,但却有所不同。
数据分析主要通过统计、计算、抽样等相关的方法,来获取基于数据库的数据表象的知识。
数据挖掘则主要通过机器学习或者是通过数学算法等相关的方法获取深层次的知识(比如属性之间的规律性,或者是预测)。
简单来说,数据分析是把数据变成信息的工具,而数据挖掘是把信息变成认知的工具,可以将数据分析得出的信息转化为有效的预测和决策。
2.数据挖掘的主要任务有哪些?
老师ppt中给出的内容
- 关联分析(关联规则挖掘)
- 聚类分析
- 分类/预测
- 孤立点(离群点)分析
另外进行一个简单的拓展 拓展部分内容同样出自《数据挖掘背景知识2——数据挖掘可以做到什么 带给我们什么?》这篇文章
数据挖掘的应用场景
1.教育领域
数据挖掘技术的应用已经渗入到教育教学的各个方面,如:
支持教育科学决策、实施个性化教育、对学生的学业成绩进行评估等。
数据挖掘的实际应用逐渐突破了传统的教学模式,改善了教学效果,促进了教学质量的提升。
2.风控领域
数据挖掘作为深层次的数据信息分析方法,能够对各种因素之间隐藏的内在联系进行全面分析。目前在风控领域可应用于:
信贷风险评估、交易欺诈识别、黑产防范及消费信贷四个方面。
通过风险预警,可以让风险管理者提前做好准备,从而为决策提供参考信息。
3.医疗领域
目前,医院已经积累了涵盖患者、费用