MSBI-DM
文章平均质量分 62
soldierluo
羽毛球
展开
-
MS决策树分析算法
MS决策树分析算法决策树算法是分类和回归算法,用于对离散和连续属性进行建模,是一种混合算法。决策树根据朝向特定结果发展的趋势进行预测。如购买自行车案例中,10名年轻客户有9名购买,而10名老年客户只有3名购买,则算法推测年龄是购买自行车的关键预测因子。它通过在树中创建一系列拆分来生成挖掘模型,每当发现输入列与可预测列密切相关时,改算法吧便向该模型的树中添加一个节点。决策树与聚类算法的区别原创 2017-07-08 17:03:44 · 932 阅读 · 0 评论 -
MS聚类分析算法
MS聚类分析算法它是一种“分段”或“聚类”算法,以将示例分组到包含相似特征的分类中。它首先标识数据集中的关系,并根据这些关系来生成一系列分类,可以设置MiniMum_Support(分类的最小支持量)和Cluster_Count(大致分类数)来限制分类的数量它有两种分类算法,通过clustering_method属性来设置 3.1. K-means算法,每个数据点只属于一个分类 3.原创 2017-07-08 17:06:35 · 2496 阅读 · 0 评论 -
MS贝叶斯分析算法
MS贝叶斯分析算法它是一种基于贝叶斯定理的分类算法,有多个底层算法支撑,该算法运算量小,可以使用该算法进行初步探测,再根据结果使用更精确的预测算法。在给定可预测列的各种可能状态的情况下,贝叶斯算法将计算每个输入列的每种状态的概率。(非常重要的概念)贝叶斯算法的输入、输出都必须为二元值属性(是、否),其它所有类型都不支持。创建贝叶斯算法挖掘结构 4.1. 新增挖掘结构视图如下,因为之前原创 2017-07-08 17:08:11 · 741 阅读 · 0 评论 -
MS时序分析算法
MS时序分析算法它是针对连续值(如时间段内的销售额)进行预测的算法(其中包含多种优化后的算法)时序算法的输入输出为同一列时序模型中的重要算法参数 3.1. Periodicity_hint:该参数提供了有关数据模式重复频率的算法信息(以数据的时序的最小单位为基准,经过N个单位重复一次就设置为{n},如:以日为基准,周为循环的话就是{7},以月为循环就是{31},以周月为循环就是{7,3原创 2017-07-08 17:09:13 · 3396 阅读 · 0 评论 -
MS关联规则分析算法
MS关联规则分析算法属于建议引擎算法,可根据已购买的商品推测出可能要购买的商品。关联规则是在大量数据事例中挖掘项集之间的关联或相关联系。典型如购物篮分析,就是购买了某一商品的用户是否会去购买另一商品。关联规则算法是Apriori算法的简单实现,下面是原理分析 3.1. 支持度:P(A∩B),既有A又有B的概率 3.2. 置信度:P(B|A),在A发生的事件中同时发生B的概率p(原创 2017-07-08 17:12:13 · 1306 阅读 · 0 评论 -
MS顺序与聚类分析算法
MS顺序与聚类分析算法 1. 它是结合了顺序分析和聚类分析的唯一算法,它是查找顺序中包含类似路径的事例的分类,也就是对相似顺序的事例进行分类。(此算法的可操作性似乎不强) 2. 分析模型的建立2.1. 数据准备,可以使用关联规则分析模型使用的数据2.2. 参考关联规则分析模型的建立,直到指定定型数据2.3.原创 2017-08-04 21:25:20 · 1058 阅读 · 0 评论 -
MS神经网络分析算法
MS神经网络分析算法 1. 神经网络算法模仿人的神经网络的工作方式,神经网络由神经元组成,它由三层结构组成分为输入层、隐含层(负责逻辑与算法)、输出层,神经网络通过训练(学习)来调整各个神经元的参数,从而实现高的预测的准确性,所以又叫机器学习。 2. 原理是针对可预测属性的每个可能状态来测试输入属性的每个可能状态,并基于定型数据计算每个组合的概率。原创 2017-08-04 21:26:01 · 802 阅读 · 0 评论 -
MS逻辑回归与MS线性回归算法
MS逻辑回归与MS线性回归算法 1. MS逻辑回归1.1. MS逻辑回归是MS神经网络算法的一个变种,有许多共性1.2. 逻辑回归的输入、输出、可为连续值与离散值,所以一般使用逻辑回归而非线性回归1.3. 回归算法是确定多个变量间相互依赖的定量关系的一种统计分析方法1.4. 逻辑回归模型的建立参考神经网络原创 2017-08-04 21:26:28 · 647 阅读 · 0 评论