机器学习
QxwOnly
宝剑锋从磨砺出,梅花香自苦寒来。
展开
-
一行代码将Pandas加速4倍
使用Modin让Python发挥到极致,详细可以浏览:http://mp.weixin.qq.com/s?__biz=Mzg5ODAzMTkyMg==&mid=2247487570&idx=1&sn=60b54b55396fa0916ead15c2a5ac5f76&chksm=c069980ff71e1119e2735d10d885288da80559dd57c1...原创 2019-12-04 09:42:43 · 153 阅读 · 0 评论 -
机器学习实战(四)k-近邻算法
一、k-近邻算法的理解1.定义k近邻算法(k-nearest neighbor)也可以叫做KNN,是一种基本的分类和回归方法.输入是训练数据的特征向量,当然,KNN是不具备显式的学习过程.假定给定一个训练数据集,且每个数据都有对应的类别,分类时,对新的数据,根据K个最近的数据类别,通过多数表达等方式进行预测.最简单的说法,k-近邻算法采用测量不同特征值之间的距离方法进行分类。2.K近邻的三个...原创 2019-07-16 20:04:57 · 1346 阅读 · 0 评论 -
机器学习实战(三)岭回归,lasso回归
在线性回归模型中,其参数估计公式为β=(XTX)−1XTyβ=(X^{T}X)^-1X^Tyβ=(XTX)−1XTy不可逆时无法求出βββ,另外如果∣XTX∣|X^{T}X|∣XTX∣越趋近于0,会使得回归系数趋向于无穷大,此时得到的回归系数是无意义的。解决这类问题可以使用岭回归和LASSO回归,主要针对自变量之间存在多重共线性或者自变量个数多于样本量的情况。注:线性回归模型的详解,博客htt...原创 2019-07-16 21:05:17 · 4572 阅读 · 0 评论 -
机器学习实战(六)决策树(上)
文章目录一、从分类问题开始二、决策树模型三、信息论基础四、决策树建立五、ID3算法六、C4.5算法前言:决策树(Decision Tree)是一种基本的分类与回归方法,本文主要讨论分类决策树。 决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。相比朴素贝叶斯分类,决策树的优势在于构造过...原创 2019-07-25 09:19:34 · 1170 阅读 · 0 评论 -
机器学习实战(六)决策树(下)CART详解
文章目录一、CART分类树回归树简介二、CART分类树分裂属性的选择三、CART回归树分类属性的选择四、剪枝的原理及分类五、CART分类回归树的剪枝六、简单总结七、优缺点前言:决策树可以分成ID3、C4.5和CART。上一篇博客,已经讲了ID3、C4.5,感兴趣的可以参考下:https://blog.csdn.net/qs17809259715/article/details/97231726...原创 2019-07-25 10:27:21 · 1389 阅读 · 0 评论 -
机器学习实战——学习之路
本篇博客意在记录学习机器学习实战中算法的过程,首先申明一下,博主是一个小白,刚开始接触机器学习,所以每学完一个算法,就会进行一次总结,写一篇博客。每篇博客仅是个人理解而写,如有错误,不足之处,欢迎指出,定会细心接纳,并及时改正。已经学过的算法:机器学习实战(一)线性回归和局部加权线性回归机器学习实战(二)logistic回归机器学习实战(三)岭回归,lasso回归机器学习实战(四)k-近...原创 2019-07-25 10:45:27 · 4639 阅读 · 1 评论 -
机器学习实战(七)支持向量机(SVM)
本篇博客动笔写这个支持向量机(support vector machine)是比较纠结的,原因很简单,一者博主是刚开始接触机器学习,对一些问题的理解还是不够深刻,怕因为写错某句话而误导大家。二者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,三者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),望采纳。我还是想尝试写一下,本文旨在讲述一下SVM的大体框架,...原创 2019-07-30 16:38:39 · 4796 阅读 · 0 评论 -
机器学习实战(八)AdaBoost算法(1)
文章目录一、Adaboost简介二、Adaboost算法过程三、Adaboost实例讲解四、Adaboost的误差界以及指数损失函数推导五、AdaBoost的优点和缺点一、Adaboost简介1.Adaboost是什么?AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由Yoav Freund和Robert Schapire在1995年提出。它的自适应在于:...原创 2019-08-09 11:06:59 · 1581 阅读 · 1 评论 -
机器学习实战(八)集成学习算法
本文转自:机器学习–集成学习(Ensemble Learning)一、集成学习法在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表现的比较好)。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,...转载 2019-08-09 15:57:49 · 929 阅读 · 0 评论 -
机器学习实战(十)Apriori详解
文章目录前言:一、关联分析二、频繁项集的评估标准三、关联规则发现四、先验原理五、Apriori算法思想六、Aprior算法流程前言:一、关联分析大型超市有海量的交易数据,作为精明的商家肯定不会放弃对这些海量数据的应用,他们希望通过对这些交易数据的分析,了解顾客的购买行为。我们可以通过聚类算法寻找购买相似物品的人群,从而为特定人群提供更具个性化的服务。但是对于超市来讲,更有价值的是找出商品之间...原创 2019-08-19 16:24:30 · 3446 阅读 · 0 评论 -
机器学习实战(九)K-均值聚类算法
文章目录前言:一、K-均值聚类算法二、算法分析三、二分k均值聚类前言:机器学习中有两类的大问题,一个是分类,一个是聚类。分类是根据一些给定的已知类别标号的样本,训练某种学习机器,使它能够对未知类别的样本进行分类。这属于supervised learning(监督学习)。聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作 unsu...原创 2019-08-17 17:17:12 · 1382 阅读 · 0 评论 -
机器学习实战(五)朴素贝叶斯算法
文章目录一、朴素贝叶斯是什么二、朴素贝叶斯的思想三、朴素贝叶斯的推导四、参数估计五、朴素贝叶斯算法过程六、朴素贝叶斯模型七、朴素贝叶斯算法分析八、朴素贝叶斯的实际应用场景一、朴素贝叶斯是什么朴素贝叶斯法(NaiveBayes)是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x ,利用贝叶斯...原创 2019-07-16 18:58:01 · 2469 阅读 · 1 评论 -
机器学习之最小二乘法
一、最小二乘法理解:1.定义先从最小二乘的名字来看,所谓最小二乘,其实也可以叫做最小平方和。那么,是什么的平方和最小呢?那肯定是误差最小,那是什么的误差呢?就是目标对象和拟合对象的误差。连起来看,就是通过最小化误差的平方和,使得拟合对象无限接近目标对象,这就是最小二乘的核心思想。可以看出,最小二乘解决的是一类问题,就是需要拟合现有对象的问题。这么看来,是不是也就可以理解为什么最小二乘应用如此广...原创 2019-07-16 16:52:49 · 3543 阅读 · 0 评论 -
Anaconda详细安装使用教程
本文转自: https://blog.csdn.net/program_developer/article/details/79677557博主写的很详细,有助于帮助大家了解。目录: Anaconda是什么? 如何安装? 如何管理包? 如何管理环境 1.Anaconda是什么?简单来说,Anaconda是Python的包管理器和环境管理器。先来解决一个初...转载 2019-04-28 17:46:29 · 1675 阅读 · 0 评论 -
主成分分析(PCA)原理详解
浏览博客时,看了博主这篇主成分分析(PCA)原理详解,恍然大悟,对主成分分析有了更深的理解,特意留下这个博客来纪念下。博主的博客地址为:https://blog.csdn.net/program_developer/article/details/80632779...原创 2019-04-28 17:52:38 · 264 阅读 · 0 评论 -
吴恩达机器学习笔记(一)绪论初识机器学习
一、什么是机器学习?机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。二、监督学习1.基本思想数据集中的每个样本都有相应的“正确答案”,再根据这些样本做出预测,得到未知数据的“正确答案”,算法的目的是给出更多正确答案。2.示例如下:(1)回归问题:离散数据集—连续输出...原创 2019-04-20 11:12:51 · 250 阅读 · 0 评论 -
对线性回归、逻辑回归、各种回归的概念学习
博主博客为:https://blog.csdn.net/viewcode/article/details/8794401 回归问题的条件/前提:1) 收集的数据2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数。然后利用这个模型去预测/分类新的数据。1. 线性回归假设...转载 2019-05-08 20:48:14 · 300 阅读 · 0 评论 -
矩阵求导的相关知识
一、矩阵求导一般来讲,我们约定 x=(x1,x2,...xn)Tx = (x_{1},x_{2},...x_{n})^Tx=(x1,x2,...xn)T,这是分母布局。常见的矩阵求导方式有:向量对向量求导,标量对向量求导,向量对标量求导。六种矩阵最整齐的求导结果:1.向量对向量求导2.标量对向量求导3、向量对标量求导二、几种重要的矩阵1、梯度(Gradient)...原创 2019-05-10 16:19:06 · 146 阅读 · 0 评论 -
机器学习实战(一)线性回归和局部加权线性回归
#!/usr/bin/env python # -*- coding:utf-8 -*-# numpy函数库中的所有模块引入当前的命名空间# 后者不建议使用,如果下次引用和numpy里的函数一样的情况,就会出现命名冲突。from numpy import *import matplotlib.pyplot as plt# 该函数是用来打开一个用tab键分割的文本文件,默认文件每行的最...原创 2019-05-28 10:30:44 · 4632 阅读 · 1 评论 -
机器学习实战(二)logistic回归
一、logistic回归1.逻辑回归假设函数逻辑回归一般用于分类问题较多,但是叫做“regression”,而线性回归一般不建议用于分类,因为输出的y的值可能超出0/1范围。这也就是为什么逻辑回归假设函数里面有sigmoid函数的原因了。2.成本函数逻辑回归问题不在采用“最小均方”误差,因为里面含有非线性的sigmiod函数,使得成本函数J不再是一个平滑的“碗”,容易导致“局部最优...原创 2019-05-28 11:31:29 · 1102 阅读 · 0 评论 -
机器学习实战——数据集及源码
链接:https://pan.baidu.com/s/1gseuFwGx9q7fkowAj1N-Aw提取码:m6bw原创 2019-05-28 12:35:07 · 475 阅读 · 1 评论 -
机器学习——各种距离度量方法总结
一、欧氏距离(EuclideanDistance)1.定义:欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。2.计算公式:二维空间公式三维空间的公式n维空间的公式3.代码实现:原生公式代码实...原创 2019-07-16 14:49:35 · 9552 阅读 · 0 评论 -
机器学习之极大似然估计
文章目录一、什么是极大似然估计?二、极大似然原理及数学表示三、极大似然估计法(Maximum Likelihood Estimation,MLE)四、 极大似然估计法求估计值的步骤:五、极大似然估计法应用六、总结一、什么是极大似然估计?1.首先来看贝叶斯分类,我们都知道经典的贝叶斯公式:2.在日常生活中,我们很容易无意中就使用到极大似然估计的思想,只是我们并不知道极大似然估计在数学中的如...原创 2019-07-16 16:21:45 · 3652 阅读 · 0 评论 -
Anaconda 下 Jupyter notebook更改默认启动路径方法
一、安装好Anaconda以后运行Anaconda Prompt输入jupyter notebook --generate-config,会出现如下图所示:二、然后找到生成的jupyter_notebook_config.py ,文件,并打开C:\Users\Ambergris.jupyter\jupyter_notebook_config.py三、修改将 #c.Notebo...原创 2019-04-25 20:14:13 · 1909 阅读 · 2 评论