Excel是大家非常熟悉的表格工具,借助它可以实现日程工作中最原始的数据处理的基本的功能,此外通过 SQL Server插件的支持,我们也可以在Excel中实现数据挖掘的功能。
此篇将先介绍Excel数据挖掘中的数据准备工作下的相关功能。
对于Excel 2010和2013来说,需要安装SQL Server的Excel数据挖掘插件才可以实现数据挖掘的功能,下载地址:
http://www.microsoft.com/en-us/download/details.aspx?id=35578
下载的时候需要注意的是下载的语言版本和x86以及x64的版本要对应得上。
安装完成后,可以在开始屏幕找到示例数据链接:
打开示例数据,可以看到在Excel文件下示例数据在不同的Sheet中。
点击其中的Sheet,可以看到此篇演示需要用到的示例数据。这是一张经过组织的客户信息表,里面包含了客户的基本信息,比如婚姻状况,性别,收入以及教育程度等信息。此外还包含一个状态列记录这个用户是否购买了自行车。
在Ribbon工具栏中可以找到数据挖掘工具集DATA MINING。
此篇介绍的是Data Preparation数据准备下的三个功能:Explorer Data浏览数据, Clean Data清除数据(这里我不太认同官方的翻译,清理数据在这里可能更贴切些。)和Sample Data示例数据。
首先点击浏览数据,浏览数据可以帮助我们在第一时间内通过这个功能对数据进行很方便的浏览。
在第一个界面中指定数据的范围。默认选择第一个选项,是一个sheet下的所有数据,如果是第二个选项的意思是选中的数