机器学习
JNSimba
腹有诗书气自华,快叫我长胖一点吧~~~~~
展开
-
机器学习~决策树
决策树是什么?决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。类似流程图的结构,每个节点都可以进行判断,然后进入不同得决策子树中,直至到达叶子节点。比如在相亲中,我们要判断是否要见对方,通常会根据几个衡量标准来做出决策,生成的决策树图如下所示:通过上面例子,我们可以得出两个比较核心的问题:1. 我们应该选择什么作为划分特征,即年龄、长相、收...原创 2020-04-18 15:26:21 · 673 阅读 · 0 评论 -
机器学习入门系列之PCA降维
目录前言PCA降维原理PCA如何降维Sklearn实现总结前言今天来说说机器学习中一个比较重要的概念——主成分分析(Principal Component Analysis),简称PCA。根据字面意思强行解释一波,就是对主要的成分分析。专业一点就是:在减少样本维数的同时尽可能的保留原样本的信息,仅保留样本中所存在的主要特性,从而可以大大节省空间和数据量。...原创 2020-04-12 22:12:08 · 880 阅读 · 0 评论 -
Kaggle入门-泰坦尼克号之灾
跟着饼干大神磕磕绊绊的走完了机器学习小组的第一期之旅,接下来的任务就是巩固一下以前的诸多知识点,有时候太忙都没有学习完;再就是参与一下实战,打打kaggle比赛,也算是应用吧,毕竟公司短期内还暂时用不到机器学习。英语本来就比较渣,看着kaggle的纯英文,一脸懵逼不知道从何下手,你如果也和我一样,可以参考这篇文章https://www.jiqizhixin.com/articles/2019-...原创 2020-02-10 11:35:59 · 1753 阅读 · 0 评论 -
机器学习~K-Means
文章目录概述原理示例Sklearn实现参考概述k-means算法是一种聚类算法,所谓聚类,是指在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。聚类算法与分类算法不同,聚类算法属于无监督学习,通俗来讲:分类就是向事物分配标签,聚类就是将相似的事物放在一起。聚类算法通常用来寻找相似的事物,比如:银行寻找优质客户,信用卡诈骗,社交划分社区圈等等。...原创 2019-12-29 14:59:44 · 394 阅读 · 0 评论 -
机器学习~逻辑回归
文章目录概述逻辑回归模型损失函数逻辑回归中的梯度下降决策边界sklearn实现总结参考概述前面说到的线性回归往往我们用来解决回归问题,今天介绍一种解决分类问题的通用算法—逻辑回归。逻辑回归是机器学习算法中出场率很高的一个算法。简单来讲,逻辑回归是将样本发生的概率和样本的特征结合在一起,比如我们可以用病人的信息,可以计算拟合出患肿瘤的概率,我们给这个概率设置一个阈值,当概率大于50%时,我们可...原创 2019-12-13 22:53:36 · 254 阅读 · 0 评论 -
机器学习~梯度下降法
何为梯度下降法概述为什么梯度方向就是函数变化最快的方向模拟实现梯度下降法一般向量化随机梯度下降法Sklearn中的梯度下降法原创 2019-12-06 12:34:57 · 396 阅读 · 0 评论 -
机器学习~线性回归初探
文章目录回归与分类简单线性回归简单线性回归实现向量化多元线性回归多元线性回归实现参考回归与分类在机器学习中,常用到的算法是分类与回归。上篇文章中(机器学习入门系列之KNN)我们讲解了KNN算法,KNN一般用来处理分类问题,但是也可以处理回归问题。那分类和回归有什么区别呢?分类和回归从本质上而言,都是一样的,都属于有监督学习,并且针对一个输入,给出一个答案。不同的是:分类处理的数据一般都是离...原创 2019-11-28 17:20:09 · 326 阅读 · 0 评论 -
机器学习~KNN算法的更多思考
文章目录由KNN算法引出的问题数据归一化缺失数据处理分类特征处理KNN的优缺点参考由KNN算法引出的问题我们最开始举得KNN算法的示例数据归一化缺失数据处理分类特征处理KNN的优缺点参考sklearn中的数据预处理和特征工程机器学习的敲门砖:归一化与KD树...原创 2019-11-22 08:43:31 · 547 阅读 · 0 评论 -
机器学习~评价模型的好坏
文章目录训练数据集与测试数据集评价分类结果评价回归结果训练数据集与测试数据集KNN算法中,我们是直接将真实数据(有特征有分类)灌到模型中,然后用测试数据与真实数据匹配,从而根据特征的距离计算,可以得到测试数据的预测分类。因为测试数据的分类是未知的,所以我们没办法来评估我们预测的精准度,即模型的好坏,也就造成了我们对模型的预测结果的可信度无法估计。因此再实际应用中,我们会将真实数据集按照一定...原创 2019-11-17 13:36:33 · 807 阅读 · 0 评论 -
机器学习~KNN算法
概述KNN邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。它是一个有监督的机器学习算法,但是却没有训练过程,属于懒惰学习(lazy learning),即数据集事先已经有了分类和特征值,待收到新样本后直接进行处理。原理算法描述1)计算...原创 2019-11-08 21:57:38 · 240 阅读 · 0 评论