以下是SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析的第四部分,用IBM SPSS 对关联大数据平台帆软finebi获取的数据源进行分类算法处理。
1.编程基础
数据挖掘需要一定的编程基础,因为要实现模型以及数据的处理很多工作都是需要程序来进行的,数据挖掘常用的编程语言如下:
SQL:数据库的熟练使用是任何数据挖掘人员必不可少的技能。
C++ :有很多的标准模板库以及机器学习模型库进行调用可以方便编程实现。
Python:对字符串处理有极大的优势,是解释型语言,实现简单,而且有很多开源的机器学习模型库的支持,可处理大规模数据。
Matlab:拥有强大的矩阵运算,也是解释型语言,有很多发展较成熟库可以直接调用,支持数据结果的可视化表示,但是处理数据量有限。
R:近年兴起的数据分析编程语言,数据可视化做的比较好,语法简单,学习成本很低,很多非程序设计人员都可以数量掌握。
Java:使用范围最广的编程语言,有很多社区进行交流,进行编程实现具有灵活高效的特点,不足之处就是实现功能的代码量较大(相对于其他数据挖掘编程语言)。
Scala: 一种具有面向对象风格、函数式风格、更高层的并发模型的编程语言。同时Scala是大数据处理平台Spark的实现语言。