机器学习
David_Hdw
这个作者很懒,什么都没留下…
展开
-
word2vec的数学原理
word2vec 中的数学原理详解:https://www.cnblogs.com/peghoty/p/3857839.html转载 2020-08-19 01:08:22 · 222 阅读 · 0 评论 -
关于pytorch在使用torch.nn.functional.cross_entropy的注意点
在使用pytorch实现textcnn进行文本分类时,参考了别人的代码(keras),在使用torch.nn.functional.cross_entropy纠结了很久,最后发现的下面的文章:https://www.cnblogs.com/marsggbo/p/10401215.html总结了以下的注意点:在网络的forward最后输出时不用接softmax,直接全连接输出n类即可。...原创 2019-07-30 23:11:59 · 10689 阅读 · 1 评论 -
机器学习之常见的损失函数(loss function)
解决一个机器学习问题主要有两部分:数据和算法。而算法又有三个部分组成:假设函数、损失函数、算法优化。我们一般在看算法书或者视频教学时,更多的是去推算或者说参数估计出其假设函数,而往往不太注重损失函数,但是损失函数在面试时却是一个很重要的知识点。所以仅在此以自己理解的方式总结一些常见的损失函数,作为笔记方便日后复习。参考文章:一、总览在机器学习中,通常把模型关于单个样本预测值与真实值的差...原创 2019-03-06 09:40:43 · 38973 阅读 · 3 评论 -
机器学习之特征工程(Feature Engineering)
什么是特征工程?有什么用呢?特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。更好的特征工程意味着更强的灵活度,更好的特征意味着只需用简单模型,更好的特征意味着更好的结果。数据清洗特征处理在特征处理中,主要有一下几种类型需要进行一些处理: 数值型 类别型 时间类 文本类 统计类 组合...原创 2019-01-14 22:27:24 · 2793 阅读 · 0 评论 -
机器学习之集成学习(ensemble learning)
写本文的目的:博主本人正在入门机器学习,期间对于每个算法都看了几遍书,写下这篇文章希望可以用自己理解的方式来记录,加深对算法的理解。 记下自己的理解,方便日后进行复习。集成学习(Ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统、基于委员会的学习等。集成学习的一般结构为:先产生一组“个体学习器”,再用某种策略将它们结合起来。集成中只包含...原创 2018-11-10 16:42:47 · 59521 阅读 · 4 评论 -
机器学习之决策树(Decision Tree)
写本文的目的:博主本人正在入门机器学习,期间对于每个算法都看了几遍书,写下这篇文章希望可以用自己理解的方式来记录,加深对算法的理解。 记下自己的理解,方便日后进行复习。决策树(Decision Tree)是一种基本的分类与回归方法。决策树模型呈树形结构,其主要优点是模型具有可读性,分类速度快。如下图,决策树模型,其中最上的圆为根节点,其余的圆为内部节点,方形为叶节点。叶节点对应于决策结果...原创 2018-10-29 11:26:43 · 1669 阅读 · 0 评论 -
机器学习之支持向量机(Support Vector Machines)
支持向量机(Support Vector Machines, SVM)是一种二分类模型。其基本模型是定义在特征空间上的间隔最大化的线性分类器,通过引入核技巧的方式,可以实现非线性分类。支持向量机的学习策略就是间隔最大化。间隔最大化的直观解释是:对训练数据集找到几何间隔最大的超平面意味着以充分大的确信度对训练数据进行分类。也就是说,不仅将正负实例分开,而且最难分的实例点(离超平面最近的点)也有足...原创 2018-10-22 21:31:08 · 2821 阅读 · 0 评论 -
机器学习之朴素贝叶斯(Naive Bayes)
贝叶斯概率以18世纪的一位神学家托马斯·贝叶斯(Thomas Bayes)的名字命名。一、为什么叫朴素贝叶斯?朴素贝叶斯是经典机器学习算法之一,是基于概率论的分类算法,其原理简单,易于实现,多使用于文本分类,如垃圾邮件过滤、新闻分类等。朴素贝叶斯中的朴素是来源于该算法是基于属性条件独立性假设,即对于已知类别,假设所有属性(特征)相互独立;而贝叶斯则是其基于贝叶斯定理而得到的。所以说...原创 2018-10-15 21:41:06 · 1184 阅读 · 0 评论 -
机器学习之逻辑回归(Logistic Regression)
一、逻辑回归模型逻辑回归主要应用于二分类问题,其主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。逻辑回归把线性回归的输出集输入到simoid函数 中得到: .sigmoid函数自变量为实数集R,即自变量的取值范围在负无穷到正无穷...原创 2018-10-08 17:02:37 · 2709 阅读 · 0 评论 -
详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
本文作者: nebulaf91 本文原始地址:http://blog.csdn.net/u011508640/article/details/72815981转载 2018-10-13 21:22:55 · 439 阅读 · 0 评论 -
机器学习之逻辑回归实战---信用卡欺诈检测
一、一个完整机器学习项目的流程1 抽象成数学问题 明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。 这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。 2 获取数据 数据决定了机器学习结果的上限,而算法只是尽可能逼近...原创 2018-10-10 20:26:28 · 1475 阅读 · 0 评论 -
机器学习之线性回归(Linear Regression)
在数理统计中,线性回归是这样定义的:线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。一、基本形式线性模型的基本形式:给定由d个属性描述的示例 ,其中 是x在第i个属性上的取值,线性模型试图学到一个函数,该函数通过属性的线性组合来进行预测,表示为: ---- (1). 用向量表示为: ----- (2),当学到w和b之后,模型就可以...原创 2018-10-01 17:42:11 · 1594 阅读 · 0 评论