数学相关
文章平均质量分 66
N拳超人
美国富士康
展开
-
统计学 入门基础概念篇 - Descriptive Statistics: Charts and Graphs(个人笔记)
Graphically, The center of a distribution is located at the median of the distribution.The spread of a distribution refers to the variability of the data.ShapeThe shape of a di原创 2016-06-01 01:02:41 · 5524 阅读 · 0 评论 -
统计学 简单的线性回归(Linear Regression) - 最小二乘法 (least square method)
线性回归的作用: 当我们获得数据之后, 我们想要知道这些数据间元素的关系, 我们可以定义一个等式去描述这中关系. 这就是线性回归的作用. dependent variable: 就是要被预测的变量Independent variable: 就是用来预测的变量以下这个公式就是一个简单的线性回归的模型. beta 0 和 1 都是模型的变量epsilon 是随机变量, 作为error term. (...原创 2016-06-18 04:50:32 · 19329 阅读 · 4 评论 -
Markov Model 马可夫模型 & Hidden Markov Model 隐马可夫模型
马可夫模型是什么? 是一种随机模型,这种模型假设系统将来的状态是由当前的状态转变而来的, 并且不受当前状态之前的状态影响。 - 以城市旅游为例子: 我先去纽约 然后去波士顿 最后去华盛顿, 那么我们认为 到波士顿是基于纽约而来的,同理到华盛顿是基于 波士顿而来的。马可夫链是什么? 就是系统状态转移的路径。 从以下的例子可以得出 4条 序列, 那么将这 4 条原创 2016-11-28 02:02:20 · 1940 阅读 · 0 评论 -
蓄水池抽样 - Reservoir Sampling
转自: http://www.guokr.com/blog/745588/题目要求:从个元素中随机抽取个元素,但的个数无法事先确定。在实际应用中,往往会遇到很大数据流的情况。因此,我们无法先保存整个数据流然后再从中选取,而是期望有一种将数据流遍历一遍就得到所选取的元素,并且保证得到的元素是随机的算法。蓄水池抽样算法:先选取个元素中的前个元素,保存在集合中原创 2016-08-02 03:04:48 · 501 阅读 · 0 评论 -
统计学 入门基础概念篇 - Descriptive Statistics: Quantitative Measures(个人笔记)
Qualitative variable: qualitative variable take on values that are names or labels. The color of a ball or the breed of a dog.Quantitative variable: are numeric. it represent a measurable quan原创 2016-05-21 03:28:49 · 4042 阅读 · 0 评论 -
统计学 决定系数(Coefficient of Determination) 和 相关系数 (Correlation of Coefficient )
在对数据进行线性回归计算之后,我们能够得出相应函数的系数, 那么我们如何知道得出的这个系数对方程结果的影响有强呢?所以我们用到了一种方法叫 coefficient of determination (决定系数) 来判断 回归方程 拟合的程度.首先我们先定义几个概念1. Sum Of Squares Due To Error 对于第i个观察点, 真实数据的Yi与估原创 2016-06-21 23:45:47 · 74316 阅读 · 0 评论 -
Categorical, Ordinal, Interval - 变量之间的区别
Categorical variable: 是种类型变量 例如: 性别(男,女); 头发颜色(红, 黑 ...).注意: 这些变量之间没有固有的顺序, 也就是说 你不能把这些种类给排序.Ordinal variable: 类似categorical variable 注意: 它的变量之间存在固有的顺序 比如 (低, 中, 高) (小学, 中学, 高中..) 或者 病人疼痛指原创 2016-07-14 20:45:58 · 7743 阅读 · 0 评论 -
统计学 分布篇 - Uniform Probability Distribution(均匀分布)
均匀分布:分为 离散随机分布 和 连续随机分布我们这里学习连续随机分布:例子: 假设一个随机变量x表示飞机从芝加哥到纽约的飞行时间, x可以是在120 分钟到140分钟之间的任意值。 所以飞机飞行时间 在 120 ~ 140 分钟的概率是 1 / (140 - 120) = 1/20.则 pdf = 因为是连续函数, 所以求的概率也必须是一个范围内的概率,在图像上可以使原创 2016-06-16 10:45:18 · 13299 阅读 · 0 评论 -
统计学 假设检验(Hypothesis Testing)
什么是假设检验: 通过设定一个假设, 然后通过收集数据、计算等操作来判断这个假设是否成立。假设检验的步骤:1. 设定 null hypothesis 和 alternative hypothesis2. 收集数据3. 基于收集的数据,来判断 拒绝 或者 接受 null hypothesis值得注意的是:H0 - null hypothesisH1 -原创 2016-06-29 08:53:46 · 22888 阅读 · 1 评论 -
统计学 分布篇 - Normal/Gaussian Distribution(正太分布)
正太分布/高斯分布: 是连续概率分布的一种; 当真实的随机变量分布未知时经常使用它作为假设分布.若随机变量X服从 平均值 {\displaystyle \mu }. 标准差 Sigma, 则记做: {\displaystyle \sigma 概率密度函数(PDF):了解什么是PDF? 了解PDF分布图示:原创 2016-06-14 21:54:17 · 7082 阅读 · 0 评论 -
统计学 分布篇 - Hypergeometric Distribution(超几何分布)
超几何分布: 是 离散随机分布的一种. 它描述的是 从 n 中 拿 k 个成功的事件的概率( 不放回, 不放回意味着该事件是非独立事件), 其中在 N 中一共有 K 个成功事件. n 为 样本数量, k 为样本中成功的概率N为 事件的总数量(population), K为 在N中 事件的总数量.note: 超几何分布和二项分布是相互对立的, 因为二项分布 处理的是独立随机事原创 2016-06-15 04:35:13 · 12542 阅读 · 0 评论 -
统计学 分布篇 - Poisson Distribution(泊松分布)
泊松分布: 是离散随机分布的一种; 通常被使用在估算在 一段特定时间/空间内 发生事件数量的概率.使用泊松分布需要满足的前提条件:在 两个 相同大小/长度的 时间/空间内, 一个事件的发生的概率是相同的.事件发生于不发生是相互独立的\不受其他事件的发生或者不发生影响.PMF( probability Mass Function/概率质量函数)原创 2016-06-14 23:48:18 · 36512 阅读 · 2 评论 -
统计学 入门基础PDF( Probability Density Function) 和PMF ( Probability Mass Function )
PMF( 概率质量函数 ): 是对 离散随机变量 的定义. 是 离散随机变量 在各个特定取值的概率. 该函数通俗来说,就是 对于一个离散型概率事件来说, 使用这个函数来求它的各个成功事件结果的概率.PDF ( 概率密度函数 ): 是对 连续性随机变量 的定义. 与PMF不同的是 PDF 在特定点上的值并不是该点的概率, 连续随机概率事件只能求一段区域内发生事件的概率, 通过对这段区间进原创 2016-06-10 03:57:24 · 13593 阅读 · 0 评论 -
统计学 入门基础概念篇 Probability 概率部分 (个人笔记)
排列 \ 组合 Combination : sometimes, we want to count all of the possible ways that a single set of object can be selected without regard to the order in which they are selected. 组合就是从一堆东西里面选出一定量的元素并且原创 2016-06-09 02:43:39 · 16152 阅读 · 0 评论 -
统计学 Logistic Regression (逻辑回归)
( Logistic Regression )逻辑回归: 是一种因变量是categorical variable的回归模型, 通过使用logistic function估算概率来测试categorical variable 和一个或多个自变量的关系.例子: 我们想要知道 今天是否下雨, 可以通过给定几个输入参数然后判断; 松鼠是否带有瘟疫等等...note: categor原创 2016-06-24 23:31:22 · 4046 阅读 · 0 评论 -
数学 浅入浅出 的 贝叶斯
目的最近上了 机器学习大学! 想把自己觉得有趣的知识整理下,以及看看这些基础知识能在实际上有什么应用。什么是贝叶斯我的理解是 如果两个事件相互联系那么在概率上他们也存在一种联系,这种联系能被用来更加精确的得出概率结果。比如,年龄和是否得病有关,那么知道年龄从而计算出来是否的病的概率 比 不知道年龄从而计算出来是否得病的概率要更加准确。简单的例子背景:虾图城市每天下雨的概率...原创 2018-10-22 13:01:19 · 402 阅读 · 0 评论