机器学习
辰辰沉沉大辰沉
某厂前端 xuelq007.com
展开
-
平均数、中位数、众数 三者的联系与区别
原文链接:http://www.360doc.com/content/18/0717/09/57858800_771067787.shtml个人理解,说简单点: 一组数据中如果有特别大的数或特别小的数时,一般用中位数 一组数据比较多(20个以上),范围比较集中,一般用众数 其余情况一般还是平均数比较精确一、联系与区别: 1、平均数是通过计算得到的,因此它会因每一个数据的变化而变...转载 2018-07-17 09:23:08 · 93332 阅读 · 0 评论 -
优达学城机器学习之--决策树(Decision Trees)
前言决策树(Decision tress)是继朴素贝叶斯(NB),向量机(SVM)之后的另一种监督分类算法(supervised classification algorithm)。决策树已经有几十年的历史,稳定性非常好。和支持向量机类似,决策树也可以使用核技巧,将线性决策面转换为非线性的决策面。前置知识可线性分离的数据有一个人喜欢冲浪,帆板冲浪需要满足两个条件,要有风,要...原创 2019-02-26 09:20:13 · 1930 阅读 · 0 评论 -
优达学城机器学习之--支持向量机(SVM)
前言SVM是支持向量机的简称(Support Vector Machine)文章目录如下:简述简述简单的来说,支持向量机所做的就是去寻找两类数据之间的分割线(seperatin line),或者称为超平面(hyperplane)。假设我们有两类数据,支持向量机就是把这些点作为输入数据,输出一条线将这些数据分类。选择分隔线为什么选择中间这条线作为分隔线?与其他线相...原创 2019-01-16 09:49:37 · 1978 阅读 · 0 评论 -
优达学城机器学习之--朴素贝叶斯
前言通过漫长的先修课程,终于来到了真正的机器学习。从散点图到决策面机器学习算法做的事情是定义了一个所谓的决策面(decision surface)。决策面通常位于两个不同类之间的某个位置上。当我们使用决策面,那么判断标记所属的分类就简单多了。可将决策面泛化为区分数据的不同类型,可以对之前从未出现的数据点进行分类。当决策面是一条直线时,我们称它为线性决策面。机器学习算法所做的是根据...原创 2018-12-26 09:40:33 · 2327 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(七)- 卡方检验
scale of measurement (测量尺度)χ\chiχ<sup2ordinaral data ratio data…goodness of fit/test for independency泰坦尼克原创 2018-11-20 09:48:14 · 2697 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(六)-线性回归 Regression
前言原创 2018-10-08 09:22:27 · 2639 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(五)-相关性 Corelation
前言原创 2018-09-29 09:41:42 · 2990 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(四)-F分布
前言优达学城从这期开始,忽然没有中文字幕了。。只好自己尽量翻译了。目录如下:提出背景提出背景之前学习的t分布都是基于两个样本进行显著性检验。如果我们有很多样本呢,想要知道它们之间是否存在显著性差异。但是我们不可能两两的去对比,这时就需要新的统计方法: One Way ANOVA.基本思路如下:...原创 2018-09-20 09:36:10 · 2867 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(三)- t分布
前言接着上一篇t分布,主要内容有:相依样本 vs 独立样本独立样本 (Independent sample) 独立样本t统计量 相依样本 vs 独立样本相依样本或重复测量,这个概念指的是为同一人提供两种条件,看看他们对这两种条件的反应。这两种条件可以是对照组和处理组,或者两种处理类型,或者可以是纵向研究,在某个时间点测量某个变量,然后在另一个时间点再次测量该变...原创 2018-09-06 20:33:16 · 2873 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(二)- t分布
前言关于t分布背后的故事,可以参考这篇文章,讲的非常好。原创 2018-08-27 22:49:43 · 3697 阅读 · 0 评论 -
Udacity课程脉络-统计学基础(一)
抽样分布 中心极限定理:对于均值分布,其中每个均值都是样本量为 n 的均值,该分布的标准偏差就等于总体标准偏差除以平方根 n,这就叫做中心极限定理,数学公式表达为 M = ( X1 + X2 + … + Xn ) / n M ~ N(μ,σ²/n)中心极限定理适用于任何总体,总体可以是任何形状。假设我们从中抽取一个样本并计算出均值,然后再抽取出一个样本并计算出均值,持续这么操...原创 2018-08-15 11:17:19 · 3585 阅读 · 0 评论 -
优达学城机器学习之--聚类(Cluster)
前言这章讲的其实是非监督学习。大多数情况下从现实世界获取的数据并不附有标记,通过非监督学习仍然可以从这些数据中有所收获。最基本的聚类算法,也是目前使用最多的聚类算法叫做K-均值(K-Means)。文章目录如下:聚类简单应用假设John和Katie都喜欢收藏电影并为它们划分等级,从非常差到非常好。John偏好动作片,Katie偏好文艺片,如下图所示,无需了解电影的细节信息,我们就可...原创 2019-03-29 09:29:44 · 1898 阅读 · 0 评论