自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 4.3.1有监督学习(二) - 决策树(Decision Tree) - 构建树的核心指标

简介决策树是与有监督学习中的常用方法。决策树的算法多见于分类问题中,即我们常说的分类树(Classification Tree);少数情况下,决策树也可以用于连续问题,即回归树(Regression Tree)。总体而言,决策树是基于树状结构来进行决策的,它模仿了人在面临决定时自然的处理方式,并将这种决策的过程用树的姿态展现出来。一句话解释版本:决策树是在模仿人的决策过程,构造树的指标...

2018-06-15 13:19:09 3207 1

原创 3.1数据采集(一) - 数据采集的步骤与方法

简介数据采集就是搜集符合数据挖掘研究要求的原始数据(Raw Data)。原始数据是研究者拿到的一手或者二手资源。数据采集既可以从现有、可用的无尽数据中搜集提取你想要的二手数据,也可以经过问卷调查、采访、沟通等方式获得一手资料。不管用哪种方法得到数据的过程,都可以叫做数据采集。一句话解释版本:数据采集就是怎么获得原始数据,如果把数据采集看成吃饭,自己撸起袖子做饭就是用一手数据,点外卖就是用二手数据。...

2018-06-13 17:41:53 42697

原创 4.2数据探索(一) - 数据探索的方法

简介数据探索是在具有较为良好的样本后,对样本数据进行解释性的分析工作。在我看来,数据探索是数据挖掘较为前期的部分。它并不需要应用过多的模型算法。数据探索更偏重于定义数据的本质,描述数据的形态与特征并解释数据的相关性。通过数据探索的结果,我们能够更好的开展后续的数据挖掘与数据建模工作。一句话解释版本:数据探索要弄清楚这些问题:样本数据长什么样子?有什么特点?数据之间有没有关系?样本数据是否能满足建模...

2018-06-08 09:53:29 17502

原创 5测试评审(二) - 项目测试方法

简介上一篇中讲到了测试的整个流程,以及测试的各个阶段。这一篇主要讲在四个测试阶段中常用的一些测试方法。一句话解释版本:这个没什么一句话好解释的,想了半天,只能说测试方法的选择要结合测试中不同的阶段,结合测试用例选择方法吧。...

2018-06-05 11:41:26 688

原创 5测试评审(一) - 项目测试流程与阶段

简介测试评审是项目正式交付之前的必要环节。不管是系统、脚本还是报表,在试运行前均需要进行全面细致的测试工作。测试这个东东,也属于其貌不扬,一扬以来把人磨死的那种。要真正在实际中懂得测试,不是要会多少种方法,而是需要了解测试中总共有哪些东西可以测。一句话解释版本:测试中可以测这些:代码,接口,需求,用户。他们分别对应测试中4个主要的模块,即单元测试、集成测试、系统测试、验收测试。数据分析与挖掘体系位...

2018-06-04 17:15:03 7785

原创 数据科学猫:有监督学习的定义与模型

简介有监督学习是与无监督学习相对应的概念。它是数据分析中最常见的建模形式。一句话解释版本:有监督学习知道预测的主体,它通过寻找并定义自变量(一堆属性,X)与因变量(预测目标,Y)之间的关系,以实现通过X预测Y的目的。数据分析与挖掘体系位置有监督学习的目的性很强。所以在数据分析与数据挖掘中,有监督学习与数据分析的关系更大;无监督学习与数据挖掘的关系更大。但是它们都是数据建模领域的知识。有监督学习在整...

2018-06-04 11:49:52 7102 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除