理想不闪火
成为优秀的CVer,
目前在读软件工程,计算机视觉、深度学习和医学图像处理专攻,
偶尔也搞迁移学习和全栈开发。
展开
-
2022年美国大学生数学建模(MCM/ICM)C题:量化交易策略
2022年美国大学生数学建模(MCM/ICM)C题:量化交易策略原创 2022-02-18 10:19:13 · 13215 阅读 · 3 评论 -
机器学习(MACHINE LEARNING)从零搭建一个汽车状态分类器(Tensorflow)
文章目录源码1 分析数据1.1 目标数据网站1.2 数据信息(转成onehot)1.3 数据预处理2 搭建模型2.1 导入数据2.2 搭建网络2.3 训练网络2.5 可视化学习过程源码完整代码已经上传到我的Github!1 分析数据1.1 目标数据网站HERE!数据位置:属性信息:1.2 数据信息(转成onehot)previous:After:首先我们需要了解一下...原创 2020-05-02 17:07:59 · 473 阅读 · 3 评论 -
【机器学习】解决中小微企业的信贷决策问题(二)
【机器学习】解决中小微企业的信贷决策问题(二)文章目录符号说明模型的建立与求解参考符号说明模型的建立与求解5.1 问题一的模型建立和求解5.1.1 层次分析法计算各项指标的主观权向量选定“进项总金额、进项总税额、进项数、销项总金额、进项发票有效率、销项总 税额、销项数、销项发票有效率、信誉评级、是否违约”十个指标为准则层,用层次分 析法求它们的权重,构建层级结构模型。构造判断矩阵(成对比较矩阵),将 n 个因素 C1,C2,…,Cn 之间两两对比,用 aij 表 示 Ci 和 Cj原创 2021-07-29 09:10:13 · 976 阅读 · 0 评论 -
【机器学习】解决中小微企业的信贷决策问题(一)
【机器学习】解决中小微企业的信贷决策问题(一)文章目录概述问题重述问题分析数据预处理说明模型假设未完待续!参考概述中小微企业对我国国民经济发展做出巨大贡献,但由于其自身存在规模较小、可以 抵押的资产少等问题,在筹集资金方面仍然具有较大的缺口[1]。银行需要通过信贷风险 评估筛选出实力强,信誉好的企业给与贷款,它即关乎银行自身的发展,又关乎企业的 生死存亡。因此需要建立一套有效的信贷风险评估体系,以此降低风险。本文构建了一 个信贷风险评估模型来对企业的信贷风险进行量化分析,并且根据信贷原创 2021-07-29 09:10:03 · 1927 阅读 · 0 评论 -
【机器学习】通俗的元胞自动机算法解析和应用
【机器学习】通俗的元胞自动机算法解析和应用文章目录1 元胞自动机的定义2 元胞自动机的组成3 元胞自动机的特征4 Python实现元胞自动机(生命游戏)5 总结6 Github(华盛顿州大黄峰分布预测和分类)1 元胞自动机的定义元胞自动机(Cellular Automata,简称CA)是一种应用比较广泛的模型理论,由冯·诺依曼创始,经数学家Conway、物理学家Wolfram等人的贡献后迅速发展。在物理学定义上,元胞自动机指的是,定义在一个由具有离散、有限状态的元胞组成的元胞空间上,按原创 2021-07-09 11:19:55 · 2108 阅读 · 0 评论 -
【机器学习】Apriori 算法进行关联分析和FP-growth算法
【机器学习】Apriori 算法进行关联分析和FP-growth算法文章目录1 关联分析2 FP-growth算法理解和实现3 FP增长算法的频繁项集产生4 FP-Growth关联分析算法在网络监控领域的应用1 关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式:频繁项集(frequent item sets): 经常出现在一块的物品的集合。关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。相关术语关联分析(关原创 2021-07-07 16:08:04 · 365 阅读 · 0 评论 -
【机器学习】树回归和聚类算法解析和应用
【机器学习】树回归和聚类算法解析和应用文章目录1 树回归2 CART ( Classification And Regression Tree) 分类回归树3 K-means 3.1 合理选择 K 值 3.2 采用核函数 3.3 收敛证明4 聚类应用1 树回归树回归 概述我们本章介绍 CART(Classification And Regression Trees, 分类回归树) 的树构建算法。该算法既可以用于分类还可以用于回归。树回归 场景当数据拥有众多特征并且特征之间关系十原创 2021-07-04 10:09:46 · 458 阅读 · 0 评论 -
【机器学习】支持向量机和ensemble method的解析应用
【机器学习】支持向量机和ensemble method的解析应用文章目录1 SVM概述2 项目案例: 手写数字识别的优化(有核函数)3 随机森林4 集成方法(Ensemble methods)5 用Adaboost算法来预测森林火灾的发生6 人脸识别(Adaboost)1 SVM概述支持向量机(Support Vector Machines, SVM): 是一种监督学习算法。支持向量(Support Vector)就是离分隔超平面最近的那些点。机(Machine)就是表示一种算法,原创 2021-07-04 10:09:39 · 349 阅读 · 0 评论 -
【机器学习】基于概率论的分类方法和Logistic回归
文章目录1 朴素贝叶斯2 朴素贝叶斯图像像素分割实战——Nemo鱼图像分割(python代码+详细注释)3 Logistic回归4 梯度上升法5 Logistic回归总结1 朴素贝叶斯贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。贝叶斯理论我们现在有一个数据集,它由两类数据组成,数据分布如下图所示:我们现在用 p1(x,y) 表示.原创 2021-07-04 10:09:32 · 315 阅读 · 0 评论 -
【机器学习】通俗的决策树算法讲解和应用
【机器学习】通俗的决策树算法讲解和应用文章目录1 概述2 决策树场景3 决策树开发流程4 决策树的实际运用5 机器学习决策树算法解决图像识别-ENVI决策树分类6 总结1 概述决策树(Decision Tree)算法是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。我们这章节只讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-then 规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。决策树学习通原创 2021-07-04 10:09:26 · 1066 阅读 · 0 评论 -
【机器学习】通俗的k-近邻算法算法解析和应用
文章目录1 概述1 概述原创 2021-06-29 11:33:15 · 975 阅读 · 0 评论 -
【机器学习】集成学习与模型融合方法举例
【机器学习】集成学习与模型融合方法举例文章目录1 概述 1.1 什么是集成学习2 CrossValidation 交叉验证3 stacking4 Voting投票器5 Bagging1 概述1.1 什么是集成学习所谓“三个臭皮匠赛过诸葛亮”的道理,在机器学习数据挖掘的工程项目中,使用单一决策的弱分类器显然不是一个明智的选择,因为各种分类器在设计的时候都有自己的优势和缺点,也就是说每个分类器都有自己工作偏向,那集成学习就是平衡各个分类器的优缺点,使得我们的分类任务完成的更加优秀。在大多原创 2021-06-18 11:31:34 · 515 阅读 · 0 评论 -
【机器学习】朴素贝叶斯、SVM和数据分布检验分析
【机器学习】朴素贝叶斯、SVM和数据分布检验分析文章目录1 朴素贝叶斯2 SVM 2.1 线性可分 2.2 最大间隔超平面 2.3 SVM 最优化问题3 数据分布检验方法 3.1 数据分布检验 3.2 t检验 3.3 如何检测两组数据是否同分布1 朴素贝叶斯朴素贝叶斯分类那么既然是朴素贝叶斯分类算法,它的核心算法又是什么呢?是下面这个贝叶斯公式:换个表达形式就会明朗很多,如下:我们最终求的p(类别|特征)即可!就相当于完成了我们的任务。例题分析下面我先给出例子问题。原创 2021-06-06 11:32:19 · 486 阅读 · 0 评论 -
机器学习之交叉验证方法详解【基于Scikit-Learn】
文章目录1 为什么交叉验证2 交叉验证方法2.1 简单的交叉验证2.2 k折交叉验证 k-fold cross validation2.3 代码3 留一法 leave-one-out cross validation3.1 测试代码3.2 输出结果1 为什么交叉验证在机器学习与数据挖掘中进行模型验证的一个重要目的是要选出一个最合适的模型。对于有监督学习而言,我们希望模型对于未知数据具有很强的泛化能力,所以就需要模型验证这一过程来评估不同的模型对于未知数据的表现效果。最先我们用训练准确度(用全部数据进行原创 2021-04-27 18:25:12 · 471 阅读 · 0 评论 -
【机器学习入门到精通系列】元胞自动机和代码举例(这一篇就够了!)
文章目录1 元胞自动机的定义2 元胞自动机的组成3 元胞自动机的特征4 代码1 元胞自动机的定义元胞自动机(Cellular Automata,简称CA)是一种应用比较广泛的模型理论,由冯·诺依曼创始,经数学家Conway、物理学家Wolfram等人的贡献后迅速发展。在物理学定义上,元胞自动机指的是,定义在一个由具有离散、有限状态的元胞组成的元胞空间上,按照一定的局部规则,在离散的时间维度上演化的动力学系统。在数学定义上,从不同的角度有着基于集合论的定义和拓扑学的定义,简单起见,在此不做阐述。2 元胞原创 2021-01-23 16:41:58 · 4763 阅读 · 5 评论 -
【机器学习入门到精通系列】插值与拟合
文章目录1 插值!2 一维插值拉格朗日插值法分段线性插值法例题3 二维插值网络结点插值法例题散乱数据插值4 拟合!5 区别与联系1 插值!在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离散数据点。插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。插值:用来填充图像变换时像素之间的空隙。在应用领域中,由有限个已知数据点,构造一个函数,由此计算数据点之间的函数值,称为插值。2 一维插值拉格朗日插值法基本原理构造一组基函数Lagra原创 2021-01-23 11:17:16 · 1211 阅读 · 0 评论 -
【机器学习入门到精通系列】灰色预测模型(包含一键操作举例和py代码)
文章目录1 概述2 灰色关联预测分析GM(1,1)通常可分为以下四个步骤3 一健操作步骤结果解读其他说明4 python代码1 概述灰色预测模型可针对数量非常少(比如仅4个),数据完整性和可靠性较低的数据序列进行有效预测,其利用微分方程来充分挖掘数据的本质,建模所需信息少,精度较高,运算简便,易于检验,也不用考虑分布规律或变化趋势等。但灰色预测模型一般只适用于短期预测,只适合指数增长的预测,比如人口数量,航班数量,用水量预测,工业产值预测等。灰色预测模型有很多,GM(1,1)模型使用最为广泛。2原创 2021-01-23 10:45:35 · 1485 阅读 · 0 评论 -
【机器学习入门到精通系列】遗传优化算法(scikit-opt)
文章目录1 什么是遗传算法?遗传算法过程图解相关生物学术语2 问题引出与解决一元函数最大值问题3 大体实现过程种群初始化适应度计算(种群评估)筛选交叉(交配)运算突变终止判断4 实现1 什么是遗传算法?遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,不需要确原创 2021-01-23 10:13:10 · 2718 阅读 · 0 评论 -
【机器学习入门到精通系列】粒子群优化算法
文章目录1 粒子群算法简介2 算法流程3 粒子群算法模型(不懂就不看哦)4 代码1 粒子群算法简介粒子群算法(Particle Swarm Optimization,PSO)是一种模仿鸟群、鱼群觅食行为发展起来的一种进化算法。其概念简单易于编程实现且运行效率高、参数相对较少,应用非常广泛。粒子群算法于1995年提出,距今(2019)已有24年历史。粒子群算法中每一个粒子的位置代表了待求问题的一个候选解。每一个粒子的位置在空间内的好坏由该粒子的位置在待求问题中的适应度值决定。每一个粒子在下一代的位置有原创 2021-01-22 21:29:54 · 2463 阅读 · 0 评论 -
【机器学习入门到精通系列】蒙特卡罗方法简介和代码演示
文章目录1 蒙特卡罗方法简介2 求圆周率pi的近似值3 求定积分的近似值1 蒙特卡罗方法简介蒙特卡罗(Monte Carlo)方法:简单来说,蒙特卡洛的基本原理简单描述是先大量模拟,然后计算一个事件发生的次数,再通过这个发生次数除以总模拟次数,得到想要的结果,精髓就是:用统计结果去计算频率,从而得到真实值的近似值。蒙特卡洛方法可以应用在很多场合,但求的是近似解,在模拟样本数越大的情况下,越接近与真实值,但样本数增加会带来计算量的大幅上升。蒙特卡洛模拟是一种统计学方法,基本原理是通过大量的随机样本对系统原创 2021-01-22 21:11:37 · 647 阅读 · 0 评论 -
【机器学习入门到精通系列】大规模机器学习图示
文章目录1 学习大数据集2 随机梯度下降3 MINI-Batch 梯度下降4 随机梯度下降收敛5 在线学习6 MAP Reduce1 学习大数据集2 随机梯度下降3 MINI-Batch 梯度下降4 随机梯度下降收敛5 在线学习6 MAP Reduce...原创 2020-09-09 16:13:21 · 343 阅读 · 0 评论 -
【机器学习入门到精通系列】推荐系统之协同过滤算法
文章目录1 基于内容的推荐算法2 协同过滤3 矢量化:低秩矩阵分解4 均值规范化1 基于内容的推荐算法2 协同过滤3 矢量化:低秩矩阵分解4 均值规范化原创 2020-09-09 15:08:41 · 479 阅读 · 0 评论 -
【机器学习入门到精通系列】异常检测
文章目录1 什么是异常值?2 问题提出3 高斯分布4 高斯分布的异常检测算法5 开发和评估异常检测系统6 异常检测和监督学习7 选择要使用的功能---数据变换为高斯分布8 多元高斯分布9 使用多元高斯分布来进行异常检测1 什么是异常值?在机器学习中,异常检测和处理是一个比较小的分支,或者说,是机器学习的一个副产物,因为在一般的预测问题中,模型通常是对整体样本数据结构的一种表达方式,这种表达方式通常抓住的是整体样本一般性的性质,而那些在这些性质上表现完全与整体样本不一致的点,我们就称其为****异常点,通原创 2020-09-09 11:05:55 · 466 阅读 · 0 评论 -
【机器学习入门到精通系列】无监督学习之K-means
文章目录1 K-mens聚类2 优化目标3 随机初始化4 选取聚类数量1 K-mens聚类随机初始化聚类中心,分成两簇,计算均值,移动聚类中心到均值处,不断迭代。2 优化目标3 随机初始化4 选取聚类数量...原创 2020-09-08 17:16:54 · 365 阅读 · 0 评论 -
【机器学习入门到精通系列】OVR SVMs
训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类,这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。假如我有四类要划分(也就是4个Label),他们是A、B、C、D。于是我在抽取训练集的时候,分别抽取(1)A所对应的向量作为正集,B,C,D所对应的向量作为负集;(2)B所对应的向量作为正集,A,C,D所对应的向量作为负集;(3)C所对应的向量作为正集,A,B,D所对应的向量作为负集;(4)D所对应的向量作为正集,A,B,C所对应的向量作为负集;原创 2020-09-08 16:31:03 · 1106 阅读 · 0 评论 -
【机器学习入门到精通系列】SVM与核函数(附程序模拟!)
文章目录1 核函数本质2 选取3 程序模拟3.1 模拟数据集3.2 经过高斯核,得到新的数据集!1 核函数本质1.在实际数据上经常遇到线性不可分的情况 而解决方法是将特征映射到更高维的空间去(为什么低维度线性不可分的情况映射到高维度就可以分了?).2.凡是遇到线性不可分的情况 一律映射到高维度空间 会出现维度爆炸的情况3.核函数虽然也是将特征进行从低维到高维的转化 但是是在低维上进行计算 而实际的效果表现在高维上 解决了维度爆炸的问题2 选取在我的工作中,最常用的是Linear核与RBF核。1.原创 2020-09-08 16:07:08 · 429 阅读 · 0 评论 -
【机器学习入门到精通系列】机器学习系统设计(Precision & Recall)
文章目录1 误差分析2 不对称分类的误差评估3 查准率和召回率的权衡1 误差分析2 不对称分类的误差评估3 查准率和召回率的权衡原创 2020-09-07 22:14:06 · 431 阅读 · 0 评论 -
【机器学习入门到精通系列】应用机器学习的建议(方差和偏差)
文章目录1 评估假设2 引入验证集3 偏差和方差4 正则化的偏差和方差5 学习曲线6 Debugging a learning algorithm1 评估假设2 引入验证集3 偏差和方差4 正则化的偏差和方差5 学习曲线6 Debugging a learning algorithm...原创 2020-09-07 21:36:13 · 292 阅读 · 0 评论 -
【机器学习入门到精通系列】正则化解决过拟合问题(附Iris-L1 正则化代码)
文章目录1 概述2 L2正则化3 L1正则化1 概述第一个模型是一个线性模型, 欠拟合,也称为高偏差,不能很好地适应我们的训练集;第三个模型是一个四次方的模型, 过于强调拟合原始数据,而丢失了算法的本质:若给出一个新的值使之预测,它将表现的很差,是过拟合,也称为高方差,虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好;而中间的模型似乎最合适。分类也存在如下问题:2 L2正则化通过对大权重增加惩罚项以降低模型复杂度的一种方法,权重向量w的L2范数如下实际上,这些参数的值原创 2020-09-06 20:13:02 · 812 阅读 · 0 评论 -
【机器学习入门到精通系列】Logistic回归多分类图示
文章目录1 概述2 图示1 概述2 图示原创 2020-09-06 18:58:46 · 630 阅读 · 0 评论 -
【机器学习入门到精通系列】多变量线性回归(附详细代码)
文章目录1 Gradient Descent for multiple variables2 特征缩放3 学习率4 多项式回归5 正规方程6 代码1 Gradient Descent for multiple variables2 特征缩放3 学习率4 多项式回归5 正规方程6 代码# 导包import numpy as npimport matplotlib.pyplot as plt# 数据读取 读取当前目录下.txt文档 将特征与','分开da原创 2020-09-06 15:39:39 · 972 阅读 · 0 评论 -
【机器学习入门到精通系列】Octave在Mac上的下载安装和基本使用
文章目录1 概述2 Mac操作系统上如何下载安装3 使用1 概述GUN Octave官网(https://www.gnu.org/software/octave/)是这么描述的:Octave是一门专门用于科学计算编程的语言(Scientific Programming Language),并有以下三个特点:1、强大的内建画图和可视化工具的面向数学的语法(Powerful mathematics-oriented syntax with built-in plotting and visualizati原创 2020-09-06 10:45:43 · 886 阅读 · 0 评论 -
【机器学习入门到精通系列】不废话直入正题之单变量线性回归(另附单变量非线性代码)
文章目录1 Model Represention2 Cost Function3 Gradient Decent4 Gradient Decent for regression的代码实现1 Model Represention2 Cost Function3 Gradient Decent4 Gradient Decent for regression的代码实现import numpy as npimport matplotlib.pyplot as pltdef error_原创 2020-09-05 20:23:14 · 442 阅读 · 0 评论