时光偷走初心--CSDN博客

原创机器学习-sklearn库

sklearn库导包from sklearn.datasets import load_breast_cancer,load_iris,load_boston,make_gaussian_quantiles # 乳腺癌数据集鸢尾花波士顿房价高斯分布from sklearn.preprocessi...

2019-08-17 10:58:23 193

原创 Numpy库的sign函数

Numpy库的sign函数sign（x），这是一个符号函数，用于把函数的符号析离出来。在数学和计算机运算中，其功能是取某个数的符号（正或负）：当x>0，sign(x)=1;当x=0，sign(x)=0;当x<0， sign(x)=-1；在通信中，sign(t)表示这样一种信号：当t≥0，sign(t)=1; 即从t=0时刻开始，信号的幅度均为1；当t<0， ...

2019-08-15 15:53:47 848

原创机器学习-KNN算法

机器学习-KNN算法邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。K近邻法(k-NearestNeighbor)是一种很基本的机器学习方法，能做分类和回归任务。KNN直观解释第一步：将训练集中的所有样例画入坐标系，也将待测样例画入。...

2019-08-14 09:00:26 202

原创机器学习-KNN算法

定义有监督分类、回归算法原理物以类聚人以群分输入一个样本点，计算所有样本到该样本点的欧式距离，取前k个进行决策三个要素欧式距离判断类别远近k值，选择方式过小受噪音影响多大收到其他样本影响超参数计算，找最优得分方式决策方式分类投票法带权投票法回归求均值带权求均值优点、缺点算法思想简单惰性学习，计算量大KD树，占用大量内存，计算快不会受噪...

2019-08-14 07:56:45 181

原创机器学习-朴素贝叶斯

机器学习-朴素贝叶斯先验概率与后验概率、贝叶斯区别与联系条件概率P(A|B)表示在B事件发生的情况下，A事件发生的概率。教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。假设我们出门堵车的可能因素有两个（就是假设而已，别当真）：车辆太多和交通事故。堵车的概率就是先验概率。那么如果我们出门之前我们听到新闻说今天路上出了个交通事故，那么我们想算一下堵车的概率，这个就叫做条件概...

2019-08-13 16:59:56 188

原创机器学习-损失函数，代价函数，目标函数

损失函数，代价函数，目标函数损失函数（Loss Function）定义在单个样本上，算的是一个样本的误差。比如：代价函数（Cost Function）定义在整个训练集上，是所有样本误差的平均，也就是损失函数的平均，比如：目标函数（Object Function）是最终需要优化的函数。即：经验风险+正则化项（Cost Function + Regularization）。...

2019-08-09 16:20:50 433

转载主成分分析（PCA）原理详解

https://blog.csdn.net/program_developer/article/details/80632779

2019-08-09 15:07:51 190

原创机器学习-相关概念的总结

机器学习-相关概念的总结机器学习（统计）机器学习是关于计算机基于数据构建概率统计模型并运用模型对未来未知数据进行预测和分析的一门学科。机器学习是数据分析和数据挖掘的一种比较常用、比较好的手段。研究对象：数据目标：对未知数据进行预测分析理论：概率论、统计学、信息论、计算理论、最优化理论等形式：监督学习、非监督学习、半监督学习和强化学习以数据为驱动，引入统计学的思想，让计算机来做各种各...

2019-08-09 14:48:40 295

原创机器学习-Python-pandas.DataFrame.sample 随机选取若干行

pandas.DataFrame.sample 随机选取若干行1 数据切片选取1.1 pandas.DataFrame.sample 随机选取若干行1.1.1 功能说明有时候我们只需要数据集中的一部分，并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。功能相似：numpy.random.choiceGenerates a r...

2019-08-08 17:04:12 2150

梯度下降（最速下降法）梯度下降法(Gradient Descent，GD)常用于求解无约束情况下凸函数(Convex Function)的极小值，是一种迭代类型的算法，因为凸函数只有一个极值点，故求解出来的极小值点就是函数的最小值点。梯度下降法的优化思想是用当前位置负梯度方向作为搜索方向，因为该方向为当前位置的最快下降方向，所以梯度下降法也被称为“最速下降法”。梯度下降法中越接近目标值，变量...

2019-08-07 20:58:24 1191

原创机器学习-sklearn库中OneHotEncoder 解析

概要在 sklearn 包中，OneHotEncoder 函数非常实用，它可以实现将分类特征的每个元素转化为一个可以用来计算的值。本篇详细讲解该函数的用法，也可以参考官网 sklearn.preprocessing.OneHotEncoder。解析该函数在 sklearn.preprocessing 类中，格式为：OneHotEncoder(n_values=’auto’, catego...

2019-08-07 15:17:47 1689

原创机器学习-数据预处理之独热编码（One-Hot）

机器学习-数据预处理之独热编码（One-Hot）在机器学习算法中，我们经常会遇到分类特征，例如：人的性别有男有女，国籍有中国，美国，法国等。这些特征值并不是连续的，而是离散的，无序的。通常我们需要对其进行特征数字化。那什么是特征数字化呢？例子如下：性别特征：[“男”，“女”]祖国特征：[“中国”，"美国，“法国”]运动特征：[“足球”，“篮球”，“羽毛球”，“乒乓球”]如果将上述特...

2019-08-04 21:05:51 1295 1

原创机器学习-单变量线性回归

机器学习-单变量线性回归单变量线性回归学习算法流程图创建模型我们通过一个例子作为开始，这个例子就是预测房价的例子。我们要使用一个数据集，数据集包含某地的住房价格。假设你有一朋友正想出售自己面积为1500平方英尺的房子，你要告诉他这房子可以卖多少钱。这时你就需构建一个模型，从这个数据集来看这或许是条直线，从图中你可以对你朋友说这房子可以卖28万美元左右。这就是监督学习的一个例子，...

2019-07-27 09:19:45 388

原创机器学习-决策树

机器学习之决策树概念决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算...

2019-07-26 20:46:25 569

原创机器学习之降维

机器学习之降维算法

2019-07-26 16:02:26 1225 1

原创机器学习之聚类

机器学习之聚类算法

2019-07-24 15:18:24 376 1

wzy2643的博客

原创机器学习-sklearn库

原创 Numpy库的sign函数

原创机器学习-KNN算法

原创机器学习-KNN算法

原创机器学习-朴素贝叶斯

原创机器学习-损失函数，代价函数，目标函数

转载主成分分析（PCA）原理详解

原创机器学习-相关概念的总结

原创机器学习-Python-pandas.DataFrame.sample 随机选取若干行

原创机器学习-梯度下降算法

原创机器学习-sklearn库中OneHotEncoder 解析

原创机器学习-数据预处理之独热编码（One-Hot）

原创机器学习-单变量线性回归

原创机器学习-决策树

原创机器学习之降维

原创机器学习之聚类

空空如也

空空如也