机器学习
文章平均质量分 89
wxw_csdn
金融行业多年从业,FRM持证人,带你了解金融知识及风险管理
展开
-
模型评估中的查准率、查全率、ROC曲线
P-R曲线对于二分类问题,可以将训练集的真实类别与机器学习预测的类别划分为真正例(true positive) 、假正例(false positive) 、真反倒(true negative) 、假反例(false negative) 四种情形,令TP 、FP 、TN 、FN 分别表示其对应的样例数,则显然有TP+FP+TN+FN=样例总数。分类结果的“混淆矩阵”如下:查准率 P 与查...原创 2018-10-23 22:20:22 · 1129 阅读 · 0 评论 -
机器学习实战——关联分析
机器学习——关联分析1 关联分析介绍2 Sklearn中的实现3 参考资料1 关联分析介绍关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。下面介绍关联分析中几个常用的概念:项集:商品构成的集合,集合含有几个商品就称为几项集,如{啤酒、尿布}为二项集。关联规则:商品间具有 X→YX\rightarrow YX...原创 2019-02-20 21:27:49 · 3741 阅读 · 0 评论 -
机器学习实战——利用 SVD 简化数据
机器学习实战——利用 SVD 简化数据1 SVD 的介绍2 Python 中的实现3 参考资料1 SVD 的介绍假设 A 是一个 n×nn\times nn×n 的方阵,则其具有如下形式:Aν=λνA\nu=\lambda\nuAν=λν其中 λ\lambdaλ 是矩阵 A 的一个特征值, ν\nuν 是矩阵 A 的一个nnn 维特征向量。若把矩阵 A 的 nnn 个特征值及其对应的特征向...原创 2019-03-01 11:12:38 · 524 阅读 · 1 评论 -
机器学习实战——主成分分析
机器学习实战——降维技术1 主成分分析2 sklearn中的实现1 主成分分析主成分分析(Principal Component Analysis,PCA)是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。即通过线性变换找出样本数据中最主要的属性,用样本数据中最主要的属性来代替原始样本的全部属性,也可以理解为样本点在正交变换之后的超平面...原创 2019-02-27 21:48:17 · 515 阅读 · 0 评论 -
机器学习实战——层次聚类算法
机器学习实战——层次聚类算法1 层次聚类概述2 sklearn中的实现1 层次聚类概述层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。 数据集的划分可采用"自底向上"的聚合策略,也可采用"自顶向下" 的分拆策略。层次聚类可以分为凝聚层次聚类和分裂层次聚类。分裂层次聚类采用的就是"自顶而下"的思想,先将所有的样本都看作是同一个簇,然后通过迭代将簇划分为更小的簇,直到每个簇中只有一...原创 2019-01-24 16:02:27 · 1717 阅读 · 0 评论 -
机器学习实战——密度聚类算法
机器学习实战——密度聚类算法1 密度聚类2 sklearn中的实现1 密度聚类密度聚类假设聚类结构能够通过样本分布的密集程度确定,通常情形下,密度聚类算法从样本密度的角度来考察样本之间的可连接性,并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。DBSCAN 是一种很典型的密度聚类算法,给定领域参数的半径为 e ,最小样本点为 MinPts 。该算法中几个较重要的概念如下:e 邻域:给...原创 2019-01-24 15:59:05 · 1128 阅读 · 0 评论 -
机器学习实战——Kmeans聚类算法
机器学习实战——Kmeans聚类算法1 聚类算法介绍2 sklearn中的实现1 聚类算法介绍在无监督学习中,训练样本的标记是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。聚类分析是无监督学习中的典型代表,其中比较常见的聚类算法有:K-均值聚类、密度聚类与层次聚类。接下来的文章逐一对三种聚类算法进行介绍K-均值聚类的基本思想是,对于给定的样本...原创 2019-01-24 15:53:52 · 1682 阅读 · 0 评论 -
机器学习实战——线性模型
机器学习实战——线性回归1 线性模型概述1.1 基本形式1.2 线性回归介绍1.3 线性回归的正则化2 在sklearn包中的实现1 线性模型概述1.1 基本形式假设 x=(x1,x2,...,xn)\boldsymbol x=(x_1,x_2,...,x_n)x=(x1,x2,...,xn) 其中 xix_ixi 是 x\boldsymbol xx 在第 iii 属性上的取值,则线...原创 2019-01-08 21:46:35 · 459 阅读 · 0 评论 -
集成学习——随机森林
集成学习——随机森林原创 2019-01-02 20:32:34 · 427 阅读 · 0 评论 -
集成学习——梯度提升树(GBDT)
集成学习——梯度提升树(GBDT)原创 2019-01-02 19:57:29 · 625 阅读 · 0 评论 -
机器学习实战——集成学习 Adaboost 算法
机器学习实战——集成学习 Adaboost 算法1 模型介绍1.1 集成学习概述1.2 集成学习的组合策略1.2.1 平均法1.2.2 投票法1.2.3 学习法1.3 Adaboost 算法的介绍2 sklearn中的实现1 模型介绍1.1 集成学习概述集成学习通过构建并结合多个学习器来完成学习任务。对于训练集数据,我们通过训练若干个个体学习器,通过一定的结合策略,最终可以形成一个强学习器,...原创 2018-12-25 21:22:49 · 586 阅读 · 1 评论 -
机器学习实战——支持向量机
机器学习实战——支持向量机1 模型介绍2 sklearn中的实现1 模型介绍2 sklearn中的实现原创 2018-12-05 13:51:20 · 435 阅读 · 0 评论 -
机器学习实战——Logistic回归
Logistic回归Logistic回归模型的介绍在sklearn包中的实现参考文献Logistic回归模型的介绍逻辑斯蒂(Logistic)回归是指具有如下形式的函数模型:y=11+e−zy=\frac{1}{1+e^{-z}}y=1+e−z1z=ωTx+bz = \omega^Tx+bz=ωTx+b则 yyy 的取值如下:一个事件的几率是指该事件发生的概率与不发生的概率的比值。...原创 2018-11-20 20:51:10 · 361 阅读 · 0 评论 -
机器学习实战——朴素贝叶斯
机器学习实战——朴素贝叶斯1 模型介绍1.1 朴素贝叶斯分类器1.2 朴素贝叶斯的参数估计2 朴素贝叶斯在Sklearn中的实现1 模型介绍1.1 朴素贝叶斯分类器朴素贝叶斯是基于贝叶斯定理及特征条件独立的假设来实现分类的方法,就是在已知先验概率的前提下,求后验概率的最大值。设样本集合为 xxx ,其属性集合为 {x1,x2,⋯ ,xd}\{x_1,x_2,\...原创 2018-11-13 21:52:41 · 549 阅读 · 0 评论 -
机器学习实战——决策树
机器学习实战——决策树1 决策树模型介绍1.1 ID3 算法的分类准则1.2 C4.5 算法的分类准则1.3 CART 算法的分类准则2 决策树的剪枝处理3 决策树在sklearn包中的实现1 决策树模型介绍常用的决策树算法有 ID3、C4.5与CART,其依据的分类准则分别为信息增益、信息增益比和基尼系数。1.1 ID3 算法的分类准则“信息熵” (information entropy...原创 2018-11-02 15:26:29 · 356 阅读 · 0 评论 -
sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割
sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割一 、数据预处理1. 标准化2. 归一化3. 最小最大标准化4. 缺失值插补二 、训练集测试集的划分一 、数据预处理sklearn.preprocessing 包提供了几个常见的实用功能和变换器类型,用来将原始特征向量更改为更适合机器学习模型的形式。1. 标准化按照数据集各特征的均值与方差对其进行标准化转换sklear...原创 2018-10-30 21:53:23 · 2995 阅读 · 0 评论 -
机器学习实战——KNN算法
机器学习实战——KNN算法k近邻算法的原理k近邻算法的原理k 近邻算法的工作机制非常简单:对给定的测试样本,基于某种距离度量找出训练集中与其最靠近的 k 个训练样本,然后基于这 k 个"邻居"的信息来进行预测。通常, 在分类任务中可使用"投票法" ,即选择这 k 个样本中出现最多的类别标记作为预测结果;原创 2018-10-24 20:15:19 · 327 阅读 · 0 评论 -
机器学习之HMM模型
机器学习之HMM模型1 HMM(隐马尔可夫)模型介绍1.1 HMM 模型的定义1.2 HMM 模型中观测序列的概率计算2 在 Python 中的实现1 HMM(隐马尔可夫)模型介绍隐马尔可夫模型是马尔可夫过程衍生出的概率图模型,最早由 Baum 和 Egon 于 1967 年提出, 常被用于人脸识别、语音识别、 基因工程测序、金融时间序列的建模等。该模型假设一组观测序列是由一些隐藏的状态生成,...原创 2019-08-20 19:16:51 · 1057 阅读 · 0 评论