- 博客(5)
- 资源 (1)
- 收藏
- 关注
转载 什么是协方差/协方差矩阵/矩阵特征值
一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0, 8, 12, 20]和[
2015-09-30 14:33:44 27272 2
转载 浅谈Feature Scaling--基础知识
转自:http://blog.sina.com.cn/s/blog_7f2889330101awle.html定义:Feature scaling is a method used to standardize the range of independent variables or features of data. In data processing, it is also kno
2015-09-16 13:58:31 846
转载 斯坦福大学Andrew Ng教授主讲的《机器学习》公开课观后感
近日,在网易公开课视频网站上看完了《机器学习》课程视频,现做个学后感,也叫观后感吧。 学习时间 从2013年7月26日星期五开始,在网易公开课视频网站上,观看由斯坦福大学Andrew Ng教授主讲的计算机系课程(编号CS229)《机器学习》(网址http://v.163.com/special/opencourse/machinelearning.html)(注:最早是在新浪公开课上
2015-09-14 10:52:03 917
转载 ROC曲线(Receiver Operating Characteristic Curve) 的解释
再说明这个概念之前,我们先举一个例子。考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。1、如果实例是正类被预测成正类,称之为真正类(True positive)。TP2、如果实例是负类被预测成正类,称之为假正类(False positive)。FP3、如果实例是负类被预测成负类,称之为真负类(True negat
2015-09-13 15:21:16 3253
转载 数据科学的三个重要经验
三点经验:模型评价方法是关键,特征提取是根本,模型选择而非数据集规模最费时间。文章指出,处理上万维的特征和几十万的样本的现代算法是愚蠢的,而特征工程理论还不完善,更像是一门艺术。这是数据科学大行其道的时代。各类课程、博客、培训学校如雨后春笋般出现。然而,每次我浏览这些学习资料时,我发现它们过于强调一些具体的算法。理解逻辑回归或者深度学习的原理当然很酷,可是一旦从事数据相关工作,你会发现还有
2015-09-12 13:19:02 518
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人