自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 机器学习-sklearn库

sklearn库导包from sklearn.datasets import load_breast_cancer,load_iris,load_boston,make_gaussian_quantiles # 乳腺癌数据集 鸢尾花 波士顿房价 高斯分布from sklearn.preprocessi...

2019-08-17 10:58:23 182

原创 Numpy库的sign函数

Numpy库的sign函数sign(x),这是一个符号函数,用于把函数的符号析离出来。在数学和计算机运算中,其功能是取某个数的符号(正或负):当x>0,sign(x)=1;当x=0,sign(x)=0;当x<0, sign(x)=-1;在通信中,sign(t)表示这样一种信号:当t≥0,sign(t)=1; 即从t=0时刻开始,信号的幅度均为1;当t<0, ...

2019-08-15 15:53:47 828

原创 机器学习-KNN算法

机器学习-KNN算法邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。K近邻法(k-NearestNeighbor)是一种很基本的机器学习方法,能做分类和回归任务。KNN直观解释第一步:将训练集中的所有样例画入坐标系,也将待测样例画入。...

2019-08-14 09:00:26 185

原创 机器学习-KNN算法

定义有监督分类、回归算法原理物以类聚人以群分输入一个样本点,计算所有样本到该样本点的欧式距离,取前k个进行决策三个要素欧式距离 判断类别远近k值,选择方式过小 受噪音影响多大 收到其他样本影响超参数计算,找最优得分方式决策方式分类投票法带权投票法回归求均值带权求均值优点、缺点算法思想简单惰性学习,计算量大KD树,占用大量内存,计算快不会受噪...

2019-08-14 07:56:45 167

原创 机器学习-朴素贝叶斯

机器学习-朴素贝叶斯先验概率与后验概率、贝叶斯区别与联系条件概率P(A|B)表示在B事件发生的情况下,A事件发生的概率。教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。假设我们出门堵车的可能因素有两个(就是假设而已,别当真):车辆太多和交通事故。堵车的概率就是先验概率 。那么如果我们出门之前我们听到新闻说今天路上出了个交通事故,那么我们想算一下堵车的概率,这个就叫做条件概...

2019-08-13 16:59:56 179

原创 机器学习-损失函数,代价函数,目标函数

损失函数,代价函数,目标函数损失函数(Loss Function)定义在单个样本上,算的是一个样本的误差。比如:代价函数(Cost Function)定义在整个训练集上,是所有样本误差的平均,也就是损失函数的平均,比如:目标函数(Object Function)是最终需要优化的函数。即:经验风险+正则化项(Cost Function + Regularization)。...

2019-08-09 16:20:50 412

转载 主成分分析(PCA)原理详解

https://blog.csdn.net/program_developer/article/details/80632779

2019-08-09 15:07:51 178

原创 机器学习-相关概念的总结

机器学习-相关概念的总结机器学习(统计)机器学习是关于计算机基于数据构建概率统计模型并运用模型对未来未知数据进行预测和分析的一门学科。机器学习是数据分析和数据挖掘的一种比较常用、比较好的手段。研究对象:数据目标:对未知数据进行预测分析理论:概率论、统计学、信息论、计算理论、最优化理论等形式:监督学习、非监督学习、半监督学习和强化学习以数据为驱动,引入统计学的思想,让计算机来做各种各...

2019-08-09 14:48:40 281

原创 机器学习-Python-pandas.DataFrame.sample 随机选取若干行

pandas.DataFrame.sample 随机选取若干行1 数据切片选取1.1 pandas.DataFrame.sample 随机选取若干行1.1.1 功能说明有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。功能相似:numpy.random.choiceGenerates a r...

2019-08-08 17:04:12 2125

原创 机器学习-梯度下降算法

梯度下降(最速下降法)梯度下降法(Gradient Descent,GD)常用于求解无约束情况下凸函数(Convex Function)的极小值,是一种迭代类型的算法,因为凸函数只有一个极值点,故求解出来的极小值点就是函数的最小值点。梯度下降法的优化思想是用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以梯度下降法也被称为“最速下降法”。梯度下降法中越接近目标值,变量...

2019-08-07 20:58:24 1093

原创 机器学习-sklearn库中OneHotEncoder 解析

概要在 sklearn 包中,OneHotEncoder 函数非常实用,它可以实现将分类特征的每个元素转化为一个可以用来计算的值。本篇详细讲解该函数的用法,也可以参考官网 sklearn.preprocessing.OneHotEncoder。解析该函数在 sklearn.preprocessing 类中,格式为:OneHotEncoder(n_values=’auto’, catego...

2019-08-07 15:17:47 1653

原创 机器学习-数据预处理之独热编码(One-Hot)

机器学习-数据预处理之独热编码(One-Hot)在机器学习算法中,我们经常会遇到分类特征,例如:人的性别有男有女,国籍有中国,美国,法国等。这些特征值并不是连续的,而是离散的,无序的。通常我们需要对其进行特征数字化。那什么是特征数字化呢?例子如下:性别特征:[“男”,“女”]祖国特征:[“中国”,"美国,“法国”]运动特征:[“足球”,“篮球”,“羽毛球”,“乒乓球”]如果将上述特...

2019-08-04 21:05:51 1260 1

原创 机器学习-单变量线性回归

机器学习-单变量线性回归单变量线性回归学习算法流程图创建模型我们通过一个例子作为开始,这个例子就是预测房价的例子。我们要使用一个数据集,数据集包含某地的住房价格。假设你有一朋友正想出售自己面积为1500平方英尺的房子,你要告诉他这房子可以卖多少钱。这时你就需构建一个模型,从这个数据集来看这或许是条直线,从图中你可以对你朋友说这房子可以卖28万美元左右。这就是监督学习的一个例子,...

2019-07-27 09:19:45 372

原创 机器学习-决策树

机器学习之决策树概念决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算...

2019-07-26 20:46:25 557

原创 机器学习之降维

机器学习之降维算法

2019-07-26 16:02:26 1185 1

原创 机器学习之聚类

机器学习之聚类算法

2019-07-24 15:18:24 359 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除