![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 57
大小宝
虽然长得黑,但本质是小白! 努力学习!
展开
-
【Python机器学习】之 SVM 支持向量机算法(一)
SVM 支持向量机 支持向量机(SVM)是一个功能强大并且全面的机器学习模型,它能够执行线性或非线性分类问题、回归问题,甚至是异常值检测任务。1、感知机1.1、感知机模型 假设现在要判断是否给某个客户办理信用卡,已有的是用户的性别、年龄、学历、工作年限、负债情况等信息,用户个人金融信息统计如下表所示:用户 \ 特征性别年龄学历工作年限负债情况(元)用户1...原创 2019-07-13 12:48:15 · 411 阅读 · 3 评论 -
【Python机器学习】之 KNN算法
K 近邻算法1、KNN 算法1.1、KNN 算法特点思想极度简单应用数学知识非常少效果好可以解释机器学习算法过程中的很多细节问题更完整的刻画机器学习应用的流程既可以解决分类问题、也可以解决回归问题1.2、距离1.2.1 欧拉距离(常用) 对于两个点a、b的距离计算:二维距离:(x1a−x1b)2+(x2a−x2b)2\sqrt{(x^a_1 - x^b_1)^...原创 2019-06-29 09:32:05 · 1874 阅读 · 5 评论 -
【Python机器学习】之 Linear 线性回归法
Linear 线性回归算法 回归分析是一种预测性建模技术,主要用来研究因变量(yiy_iyi)和自变量(xix_ixi)之间关系,通常被用于预测分析、时间序列等。 线性回归(Linear Regression)是利用线性回归方程的最小二乘法对一个或多个自变量和因变量之间关系进行建模的方法。 假设一个房价-房屋面积数据信息情况如下图蓝点,通过线性回归方法拟合得到房价-房屋面积之间的线...原创 2019-07-06 17:58:28 · 5701 阅读 · 1 评论 -
【Python机器学习】之 K-Means聚类算法
K-Means聚类常见的聚类方法有:K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类等。1、K-Means聚类1.1、K-Means聚类过程 K-Means 算法是一种无监督的聚类算法。K-Means核心思想是:给定的样本数据集,根据样本点之间的距离大小,把数据集划分成 K 个簇,并让簇内的样本点尽量距离近,而不同簇之间的距离极可能的远。1.2、K-Means聚类过程...原创 2019-07-20 07:46:13 · 818 阅读 · 2 评论 -
【Python机器学习】之 Boosting算法
Boosting1、Boosting1.1、Boosting算法 Boosting算法核心思想:1.2、Boosting实例 使用Boosting进行年龄预测:2、XGBoosting XGBoost 是 GBDT 的一种改进形式,具有很好的性能。2.1、XGBoosting 推导 经过 k 轮迭代后,GBDT/GBRT 的损失函数可以写成 L(y,fk...原创 2019-08-03 12:40:11 · 5303 阅读 · 0 评论 -
【Python机器学习】之 梯度下降法
梯度下降法1、梯度下降法1.1、梯度下降 梯度下降是一种非常通用的优化算法,能够为大范围的问题寻找最优解。梯度下降的中心思想就是:迭代地调整参数从而使成本函数最小化。特点:梯度下降法不是一个机器学习算法梯度下降法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数使用梯度下降方法的原因:很多机器学习的模型是无法直接求到最优解。...原创 2019-07-30 22:45:18 · 1275 阅读 · 0 评论 -
【Python机器学习】之 PCA 算法(一)
PCA 原理1、PCA 原理推导 假设有 M 个样本 x1,x2,...,xmx_1, x_2, ..., x_mx1,x2,...,xm ,每个样本点 xix_ixi 含有 N 个特征,则每个样本数据可以表示为: xi=(xi(1),(xi(2),...,(xi(n))x_i =( x^{(1)}_i, (x^{(2)}_i,..., (x^{(n)}_i)xi=(xi(1),...原创 2019-08-13 20:59:12 · 459 阅读 · 0 评论 -
【Python机器学习】之 PCA 算法(二)
PCA 算法1、主成分分析1.1、主成分分析介绍 主成分分析(PCA)是一种非常重要的无监督降维学习方法。其基本思想:找出原始数据最主要的方面来替代原始数据,使得在损失少部分原始信息的基础上极大地降低原始数据的维度。 这一方法利用正交变换把由线性相关变量表示的观测数据转换为由少数几个由线性无关变量表示的数据,线性无关的变量称为主成分。主成分的个数通常小于原始变量的个数,所以主成分分...原创 2019-08-12 21:46:40 · 1012 阅读 · 1 评论 -
【Python机器学习】之 SVM 支持向量机算法(二)
SVM 支持向量机(二)1、支持向量机 这样,由于w,x\mathbf{w,x}w,x初始值的不同,最后得到的分割超平面也有可能不同,那么一定存在一个最优的超平面,这种方法就是支持向量机。 由上述可知感知机模型,即在数据集线性可分的条件下,利用分割超平面wT⋅x+b=0\mathbf {w^T \cdot x} + \mathbf b = 0wT⋅x+b=0 把样本点划分为两类,通过计算...原创 2019-08-31 15:07:35 · 1158 阅读 · 0 评论