![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 83
yu_tsl
这个作者很懒,什么都没留下…
展开
-
Python-机器学习 入门及技巧总结
随着这两年人工智能的快速发展,机器学习与深度学习行业炙手可热,对于那些想进入这个行业的同学们,小编在这里给大家介绍一下自己的心得体会以及利用Python的一些小技巧,希望对大家有所帮助。在机器学习方面,对于想入门的新手,首先不得不提就是斯坦福大学的Andrew Ng-吴恩达,他在例如Coursera等网站上面的课程非常适合新手,并且当你入门之后,回头再看,又会有新的收获,在这里我把相应的链原创 2017-12-13 20:52:51 · 5734 阅读 · 3 评论 -
fast text
转载于(https://blog.csdn.net/john_bh/article/details/79268850)转载请注明作者和出处:http://blog.csdn.net/john_bh/ 一、简介 二、FastText原理 2.1 模型架构 2.2 层次SoftMax 2.3 N-gram特征 三、 基于fastText实现文本分类 3.1 fastTe...转载 2018-09-03 22:54:17 · 856 阅读 · 0 评论 -
机器学习算法之Ensemble
Ensemble(集成方法) 集成学习,通过构建并结合多个学习器来完成任务,即通过 弱学习器集成为一个强学习器。典型方式为 boosting 和 baggingBoosting 和 Bagging异同引用(https://www.cnblogs.com/liuwu265/p/4690486.html...原创 2018-08-30 10:43:05 · 611 阅读 · 0 评论 -
机器学习算法之决策树
决策树-DecisionTree 什么是决策树? 决策树是一种基本的分类与回归方法。其主要有点事模型具有可得性,分类速度快。学习时,利用训练数据,根据损失函数最小化原则建立决策树模型;预测时,对新数据,利用决策树模型进行分类。 决策树是一种用于...原创 2018-08-29 22:24:03 · 414 阅读 · 0 评论 -
推荐算法之协同过滤
转载于 https://blog.csdn.net/xiaokang123456kao/article/details/74735992一、什么是协同过滤?协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看...转载 2018-08-31 11:51:57 · 491 阅读 · 0 评论 -
机器学习算法之支持向量机
支持向量机——SVM优缺点:(1)非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;(2)对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心;(3)支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量;(4)SVM 是一种有坚实理论基础的新颖...原创 2018-08-28 16:18:50 · 2534 阅读 · 0 评论 -
机器学习算法之贝叶斯
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类算法,是一种古典概率模型朴素贝叶斯特点:朴素贝叶斯的优点:对小规模的数据表现很好,适合多分类任务,适合增量式训练,朴素贝叶斯法高效且易于实现。缺点:对输入数据的表达形式很敏感,分类的性能不一定很高。 贝叶斯定理:公式推导:(推荐一篇不错的文章,朴素贝叶斯算法原理小结)由上面我们得到了贝叶斯公式,而贝叶斯模型的...原创 2018-08-27 18:17:05 · 390 阅读 · 0 评论 -
机器学习算法之logistic regression
LR 算法特点:优点:计算代价不高,易于理解和实现;预测结果是界于0和1之间的值。缺点:容易欠拟合,分类精度可能不高;预测结果呈“S”型,概率变化很小,边际值太小,slope太小,而中间概率的变化很大,很敏感。 导致很多区间的变量变化对目标概率的影响没有区分度,不容易确定阀值。 公式推导: 模型解释:1. 最大似然估计:...转载 2018-08-27 11:56:48 · 358 阅读 · 0 评论 -
机器学习-笔试知识点总结
1. 偏差与方差: 偏差: 度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力 方差: 同样大小训练集的变动,导致学习性能的变化,即刻画了数据扰动对模型造成的影响 2 线性模型:线性回归模型: lasso 和ridge 分别是l1 范数和l2范数惩罚项线性分类模型 logistics线性判别分析 LDA : 目的,将训练样...原创 2018-08-09 15:10:50 · 774 阅读 · 0 评论 -
三大统计学相关系数讨论
相关系数定义为两个向量之间的相似性,最常用的相关系数是皮尔森相关,但是实际情况更加复杂,因此我们介绍一下统计学中出现的相关系数。 一 皮尔森相关 皮尔森相关描述两个变量之间的线性相关 x,y 为两个变量。适用条件:1. 两个变量都是连续变量2. 每个变量都应该是 正态分布,或者接近正态分布的单峰对称分布3. 变量之间应该为线性关系 当对...原创 2018-10-11 10:52:48 · 5896 阅读 · 0 评论