数理统计方法
bboysky45
一个没有感情的量化研究员
展开
-
数据的向量表示、降维问题及PCA算法
内容来源:http://blog.codinglabs.org/articles/pca-tutorial.html在数据挖掘或机器学习工作中,数据常被表示为向量。比如,某个淘宝店2012年全年的流量及交易情况可以看成一组记录的集合,其中每一天的数据是一条记录,格式如下:(日期, 浏览量, 访客数, 下单数, 成交数, 成交金额)其中“日期”是一个记录标志而非度量值,而数据挖掘关心的大多是度量值,因此如果我们忽略日期这个字段后,我们得到一组记录,每条记录可以被表示为一个五维向量,其中一条看起转载 2020-05-31 20:16:39 · 2839 阅读 · 1 评论 -
线性回归模型 —— 普通最小二乘法(OLS)推导与python实现
一般回归模型中回归的核心任务就是要通过样本信息来估计总体回归函数一元线性回归模型:一元线性回归模型假设x是一维的,即只考虑一个因素对y的影响,模型为 y=+x+μ, E (μ|x)= 0其中, 为回归系数。可以表示为当x = 0,时y的期望值;可以理解为x每增加一个单位,y...原创 2020-03-26 13:20:37 · 12677 阅读 · 1 评论