数学
程序员数学家
一杯敬自由,一杯敬死亡
展开
-
大数定律
大数定律定义:设随机变量是一列互相独立的随机变量(或者两两不相关),并且分别存在期望,则对于任意小的正数有:理解:随着样本数量n的增加,样本的平均数(总体中的一部分)将接近于总体样本的平均数,所以在统计推断中一般使用样本平均数估计总体平均数的值。下面我们用简单的python代码来客观展现出大数定理:import numpy as npimport matplotlib原创 2018-01-02 23:36:16 · 14523 阅读 · 0 评论 -
中心极限定理
中心极限定理定义:假设从均值为,方差为的有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本的均值的抽样分布近似服从均值为,方差为的正态分布。下面我们用简单的python代码来客观展现中心极限定理 :import numpy as npimport matplotlib as mplimport matplotlib.pyplot as plt# 防止中文乱码mp原创 2018-01-03 23:22:49 · 13289 阅读 · 1 评论 -
机器学习中的线性回归解析
线性回归定义:假设存在多个特征,其与输出存在线性关系,即:已知和,线性回归目的就是求出。下面我们开始线性回归的推导过程,最终会推导出一个非常经典的公式。首先我们假设我们已经得到值,因为是我们随机给的所以肯定存在很大的误差,我们假设这个误差为则我们用矩阵可以将线性回归表示为由于中心极限定理 服从正态分布且独立同分布,其分布均值为0,方差为已知以上信息后开始求极原创 2018-01-08 23:18:23 · 6027 阅读 · 0 评论 -
梯度下降(BGD、SGD、MSGD)差异
首先引荐一片写的很详细的博文https://www.cnblogs.com/pinard/p/5970503.html具体介绍不在累述,本文主要可视化三种梯度下降的差异先附上手动推导过程:再附上Python代码:# encoding=utf-8import numpy as npimport matplotlib.pyplot as plt#创建训练数据集#假设原创 2018-01-31 23:03:35 · 2661 阅读 · 0 评论