自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 房价预测模型

Kaggle

2018-06-28 14:36:31 6579 1

原创 KNN算法介绍

K近邻分类算法(k-Nearest Neighbor,KNN),是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。本文主要介绍KNN算法的概念和算法解析,数据集测试见我另一篇博文《KNN,决策树,朴素贝叶斯对比与应用》。

2018-07-11 00:31:09 2714

原创 决策树分类应用

- 问题描述题目要求:根据一些病人的信息,推荐合适的隐形眼镜类型 数据集信息:有关隐形眼镜,他有着24个案例,4维数据,常用于多分类问题 数据准备与数据预处理 数据来源: 隐形眼镜数据集是十分著名的数据集,它包含很多患者眼部状况的观察条件以及医生推荐的隐形眼镜类型。隐形眼镜类型包括硬材质,软材质,以及不适合佩戴隐形眼镜。 数即来源于UCI数据库。 数据如下: 数据最后一...

2018-07-11 00:16:12 5680

原创 Logistic回归问题

- 拟解决基本问题描述概述: 使用Logistic回归来预测患有疝气病的马的存活问题,这里的数据包括368个样本和28个特征,疝气病是描述马胃肠痛的术语,然而,这种病并不一定源自马的胃肠问题,其他问题也可能引发疝气病,该数据集中包含了医院检测马疝气病的一些指标,有的指标比较主观,有的指标难以测量,例如马的疼痛级别。另外,除了部分指标主观和难以测量之外,该数据还存在一个问题,数据集中有30%的...

2018-07-10 23:41:15 8505

原创 KNN,决策树,朴素贝叶斯对比与应用

三种基本的机器学习方法,KNN,决策树,朴素贝叶斯,我们尝试用同一个数据集进行训练,比较三个方法的异同和优劣。

2018-06-18 23:32:15 14858 1

原创 回归预测数值型数据

回归预测数值型数据一.回归分析1.概念回归分析是一种数学模型。当因变量和自变量为线性关系时,它是一种特殊的线性模型。 [1] 最简单的情形是一元线性回归,由大体上有线性关系的一个自变量和一个因变量组成;模型是Y=a+bX+ε(X是自变量,Y是因变量,ε是随机误差)。 通常假定随机误差的均值为0,方差为σ^2(σ^2﹥0,σ^2与X的值无关)。若进一步假定随机误差遵从正态分布,就叫做正态线性模型。一...

2018-06-18 23:04:41 1753 1

原创 PCA简化数据

【概念】PCA(principal componentsanalysis)即主成分分析技术,又称主分量分析。主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在统计学中,主成分分析PCA是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依...

2018-06-18 22:39:50 624

原创 K-均值聚类学习思考

简述:k-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。算法描述:   假设要把样本集分为c个类别,算法描述如下: (1)适当选择c个类的初始中心;(也可以随机选择)(2)在第k次迭代中,对任意一个样本,求其到c个中心的距...

2018-06-05 14:14:09 2032 1

原创 AdaBoost元算法学习理解与应用实战

据说在Deep Learning出来之前,SVM和Adaboost是效果最好的 两个算法。上一节,我们已经学习理解了SVM,本节让我们一起学习理解Adaboost并且应用吧!

2018-05-25 00:32:14 2049

原创 支持向量机的学习和理解

       有人说:“支持向量机是最好的现成的分类器。”诚然,支持向量机自诞生起就被关注并且长期使用,有点明显,人们对它的评价很高。我本人为数学专业,算法编程方面基础液比较薄弱,所以本文行文逻辑是我从零开始学习理解支持向量机的过程,多从数学角度描述并且简单化图像化,让大家更便于理解。       我们通常希望分类的过程是一个机器学习的过程。这些数据点是n维实空间中的点。我们希望能够把这些点通过一...

2018-05-22 14:18:25 2112 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除