数据挖掘是从大量的数据中去发现有用的信息,根据这些信息来辅助决策。
数据挖掘揭示的是未知的、将来的数据关系,主要的作用就是预测,采用计算机技术、统计学、模型算法等。
模型算法有分类算法、回归算法、聚类算法等,每种算法类型又包含多种不同的算法,例如分类算法,就包含逻辑回归、朴素贝叶斯、决策树等,使用的编程语言有Java语言、Python,大家听了是不是觉得很专业、很复杂?今天给大家推荐一款简单易用的工具——Smartbi Mining,是由Smartbi推出的独立产品,旨在为个人、团队、企业所做的决策提供预测性分析。
Smartbi Mining具有流程化、可视化的建模界面,内置实用的、经典的统计挖掘算法和深度学习算法,并支持Python扩展算法,基于分布式云计算,可以将模型发送到Smartbi统一平台,与BI平台完美整合。
简单拖拉拽就可轻松完成预测,实在是太方便。此次以“波士顿房价预测”数据为例来带大家窥探一下数据挖掘如何进行。
1. Smartbi Mining 操作界面
点击机器学习管理界面右上角“创建机器学习项目”,可以通过示例数据源学习数据挖掘的流程和操作(创建文件目录设置名称)。
最左侧是节点树:包含了已经开发好的所有节点。
中间是主要实现区域,将节点之间拖拽过来即可。
右侧是节点的参数配置和属性配置。
2. 数据挖掘流程
数据挖掘有一套标准的流程,可以对数据进行各种科学的处理和预测,从而发现数据本身隐藏的规律。具体流程如下:
第一步: