关于数据挖掘的综合应用

数据挖掘综合应用

这里我们的主要任务是将我们学过的数据挖掘相关的知识点联系起来,能够掌握数据挖掘的一般流程之后,可以完成数据挖掘综合应用实验。

一、数据挖掘流程
1.数据挖掘流程的概述
在实际的数据挖掘项目中,一般的流程如下:
在这里插入图片描述
2.需求分析
(1)业务理解:最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将这个信息转化为数据挖掘问题的定义和完成项目的初步计划。
(2)数据的获取和理解:数据理解阶段从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。

3.数据加载
首先我们需要将收集的数据集加载到内存中,才能进行进一步的操作。在Python基础课程中介绍过的Pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为:
(1)read_csv:从 csv 格式文件加载数据
(2)read_table:从 table 文件中加载数据
(3)read_sql: 从数据库中加载数据
注意:
read_csv 与 read_table默认使用的分隔符不同
read_csv 与 read_table常用参数:
(1)seq/delimiter: 用来制定数据之间的分隔符,read_csv默认为逗号, read_table默认为\t(制表符)。
(2)header: 用来制定标题行,如果数据集中没有标题行,则制定为None。
(3)names: 读取数据时,可以通过names属性设置列索引。
(4)index_col:可以将数据集中的某一列(某几列)设置为行索引,通过index_col来进行指定。
(5)usecols:通过 usecols 参数来设置需要使用的列。

4.数据预处理
在数据预处理的过程中主要包括两个部分:数据清洗和特征预处理。
(1)数据清洗:
缺失值处理:一般包括去除或者填补两种方式。 填补方式主要有:均值、中位数、众数、回归分析等。
异常值处理:包括特殊值 (NA)、奇异值以及数据的不一致性(如年龄<0)。
不均衡数据处理: 主要针对一个样本的数据量远大于其它样本类别的数据量。(例

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据挖掘在各行业的应用论文 数据仓库与数据挖掘.caj 空间数据挖掘技术.caj 数据仓库与数据挖掘技术及其在科技情报业的应用前景.caj 相关案件的数据挖掘.caj 数据挖掘技术.caj 一种实时过程控制中的数据挖掘算法研究.caj EIS 环境下的数据挖掘技术的研究.caj 数据挖掘及其工具的选择.caj 数据挖掘技术与中国商业银行业务发展策略.caj 数据挖掘工具DMTools的设计与实现.caj 数据仓库、数据挖掘在银行中的应用.caj 基于信息熵的地学空间数据挖掘模型.caj 数据挖掘及其在商业银行中的应用.caj 数据挖掘与决策支持系统.caj 数据仓库、数据集市和数据挖掘.caj 数据仓库与数据挖掘1.caj IDSS 中数据仓库和数据挖掘的研究与实现.caj 基于粗糙集理论的数据挖掘模型.caj 数据挖掘及其在 SXWG_EIS 中的应用.caj 数据挖掘——技术与应用综述.caj 挖掘转移规则一种新的数据挖掘技术.caj 以地物识别和分类为目标的高光谱数据挖掘.caj 数据挖掘与虚拟数据库.caj 数据挖掘与电力系统.caj 浅说数据挖掘.caj 带Rough算子的决策规则及数据挖掘中的软计算.caj 数据挖掘系统的一种实现策略.caj 信息检索中的数据挖掘技术.caj 红外光谱谱图库中的数据挖掘.caj 中介粗集及其在数据挖掘中的应用.caj 数据挖掘在音高变化规律学习中的应用.caj 数据挖掘技术在财经领域的应用.caj 知识发现和数据挖掘的研究.caj 数据仓库与数据挖掘技术浅谈.caj 用户访问模式数据挖掘模型与算法研究.caj 数据仓库的建设与数据挖掘技术浅析.caj 分类特征规则的数据挖掘技术.caj 数据挖掘技术的主要方法及其发展方向.caj OLAP和数据挖掘技术在Web日志上的应用.caj 数据挖掘技术12.caj 数据挖掘技术初探.caj 探索式数据挖掘模型的讨论.caj 前向网络bp算法在数据挖掘中的运用.caj 数据挖掘在Internet信息导航系统中的应用研究.caj 数据挖掘技术123.caj 基于粗糙集(Rough set)的数据挖掘及其实现.caj 数据挖掘技术在建模、优化和故障诊断中的应用.caj FCC油品质量指标智能监测系统的数据挖掘与修正技术.caj 一种测试数据挖掘算法的数据源生成方法.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现.caj 神经网络在数据挖掘中的应用研究.caj 数据挖掘方法的评述.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现1.caj 一个面向电子商务的数据挖掘系统的设计与实现.caj 数据挖掘技术在煤与瓦斯突出预测中的应用研究.caj 基于数据抽取器实现数据挖掘.caj 基于数据挖掘的群决策模型.caj 基于数据挖掘的普通话韵律规则学习.caj 数据挖掘和知识发现的技术方法.caj 可视化数据挖掘技术及其应用.caj 神经网络数据挖掘方法中的数据准备问题.kdh 基于CORBA的数据挖掘工具KDD-DC.caj 基于高校人事信息库的数据挖掘研究.caj 数据挖掘管理系统.caj 电信网告警数据库中的数据挖掘.caj 数据挖掘原理、方法及其应用.caj 一种基于数据仓库的数据挖掘系统的结构框架.caj OLAP与数据挖掘一体化模型的分析与讨论.caj 一种新型数据分析技术——数据挖掘.caj aaa数据挖掘数据仓库及其在电信业中的应用.caj 数据挖掘技术及其应用.caj 数据挖掘中概念树的标准、生成和实现.kdh XML与面向Web的数据挖掘技术.caj 数据挖掘数据仓库及其在电信业中的应用.caj 数据挖掘技术及其在地学中的应用.caj 结合数据融合和数据挖掘的医疗监护报警.caj 基于多媒体数据库的数据挖掘系统原型.caj 数据挖掘技术1.caj 股票信息的数据挖掘.caj 多媒体数据挖掘的相关媒体特征库方法.caj 基于数据挖掘的深部采场岩爆知识的自动获取.caj 空间数据挖掘理论与方法的研究.caj 金融数据挖掘中的非线性相关跟踪技术(英文).caj 数据挖掘技术的一个应用模型.caj DNA中的数据挖掘和启动子识别.caj 数据仓库与数据挖掘12.caj 数据挖掘系统设计.caj 数据挖掘方法的研究.caj 用数据挖掘技术优选侧钻井井位.caj 关注政府上网后的数据挖掘.kdh 数据挖掘技术及其在电力系统中的应用.caj 目前数据挖掘算法的评价.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于属性分类的数据挖掘方法.caj 基于数据挖掘模型的高压输电线系统故障诊断.caj 用于建模、优化、故障诊断的数据挖掘技术.caj 格子机数据挖掘方法.caj 数据挖掘及其在电力系统中的应用.kdh 用于

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值