机器学习
lili安
立志成为大牛的一只小菜鸟
展开
-
分类算法之支持向量机(SVM)
一、概念支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器,如果进行修改之后也是可以用于多类别问题的分类。支持向量机可以分为线性和非线性两大类。其主要思想为找到空间中的一个更够将所有数据样本划开的超平面,并且使得样本集中所有数据到这个超平面的距离最短。其决策边界是对学习样本求解的最大边距超平面。决策边界:在具有两个类的统计分类问题中,决策边界或决策表面是超曲面,其将基础向量空...原创 2019-12-30 17:04:15 · 1633 阅读 · 0 评论 -
(二) 数据挖掘之分类
一、分类的主要思想分类是一种重要的数据分析形势,它提取刻画重要数据类的模型。这种模型称为分类器,预测分类(离散的、无序的)类标号。例如:可以建立一个分类模型,把银行贷款申请划分成“安全”或"危险";销售数据的“是”或“否”;等等。这些类别可以用离散值表示,其中值之间的次序没有意义。数据分析任务都是分类,都需要构造一个模型或分类器来预测类标号。销售经理希望预测给定的顾客将花多少钱...原创 2019-12-30 16:27:18 · 2383 阅读 · 0 评论 -
K折交叉验证之Python实现
一、二折交叉验证import numpy as npfrom sklearn.model_selection import KFoldX = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])#y = np.array([1, 2, 3, 4])kf = KFold(n_splits=2)#2折交叉验证,将数据分为两份即前后对半分,每次取一份作...原创 2019-05-17 10:39:58 · 16589 阅读 · 0 评论