自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小数据研究院

知乎专栏「小数据研究院」:https://zhuanlan.zhihu.com/datapool

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习:用梯度下降法实现线性回归

之前在 机器学习算法数学基础之 —— 线性代数篇 中,总结过求解线性回归的两种方法:最小二乘法梯度下降法这篇文章重点总结一下梯度下降法中的一些细节和需要注意的地方。梯度下降法是什么假设有一个估计函数:  ,其代价函数(cost function)为: 这个代价函数是 x(i) 的估计值与真实值 y(i) 的差的平方和,前面乘上 1/2,是因为在求导的时候,这个系数就不见了。梯度下降法的流程:1)首...

2018-02-25 10:01:14 1732

原创 机器学习算法数学基础之 —— 统计与概率论篇(3)

核心问题发现数字的隐藏规律,完成分类。核心技能最大似然估计给定一个概率分布  ,已知其概率密度函数(连续分布)或概率质量函数(离散分布)为 ,以及一个分布参数  ,我们可以从这个分布中抽出一个具有  个值的采样  利用  计算出其似然函数:若  是离散分布,  即是在参数为  时观测到这一采样的概率。若其是连续分布,  则为  联合分布的概率密度函数在观测值处的取值。一旦我们获得  我们就能求得一...

2018-02-22 08:19:06 779

原创 机器学习算法数学基础之 —— 线性代数篇(2)

线性代数核心问题求多元方程组的解。核心技能乘积、内积、秩已知矩阵 A 和矩阵 B,求 A 和 B 的乘积 C=AB。矩阵 A 大小为 mxn,矩阵 B 大小为 nxp。常规方法:矩阵 C 中每一个元素 Cij = A 的第i行 乘以(点乘)B 的第 j 列。设有 n 维向量令  ,称  为向量 x 与 y 的内积。在线代中秩的定义:一个矩阵 A 的列秩是 A 的线性无关的列的极大数目。类似地,行秩...

2018-02-21 13:44:10 2197

原创 机器学习算法数学基础之——微积分篇(1)

最近在听台大老师林轩田老师的機器學習基石课程,意识到做好机器学习必须要把根本学好,也就是机器学习算法的基础 —— 数学。高等数学虽然在本科时已经学过了,但很多概念和定理由于太久不使用,很多细节已经搞不清了。所以打算在知乎记几篇笔记,分别是关于微积分、线性代数、统计与概率论三个部分的一些常用知识点。当前这篇是关于微积分部分的,包括:罗尔定理、柯西中值定理、拉格朗日中值定理、泰勒展开、夹逼准则、洛...

2018-02-13 09:35:44 7251

原创 使用 Spark ML Pipeline 进行机器学习

Spark ML Pipeline 的引入,是受到scikit-learn的启发,虽然 MLlib 已经足够简单实用,但如果目标数据集结构复杂,需要多次处理,或是在学习过程中,要使用多个转化器 (Transformer) 和预测器 (Estimator),这种情况下使用 MLlib 将会让程序结构极其复杂。所以,一个可用于构建复杂机器学习工作流应用的新库已经出现了,它就是 Spark 1.2 ...

2018-02-06 13:20:49 6295 1

原创 数据预处理之将类别数据数字化的方法 —— LabelEncoder VS OneHotEncoder

LabelEncoder 和 OneHotEncoder 是什么在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。 在使用 Python 进行数据处理时,用 encoder 来转化 dummy variable(虚拟数据)非常简便,encoder 可以将数据集中的文本转化成0或1的数值。 LabelEncoder 和 OneHotEncoder 是 scikit-lear...

2018-02-04 15:07:59 5674

原创 Spring MVC 常用注解之 Controller 篇

Shopping Without Vision 的 project 终于告一段落,teamwork 非常给力,中间也遇到很多困难,还好都一起克服了。这是做的第二个 Spring MVC 项目了,对这个框架在很多细节上又多了些深入的理解。这篇文章想总结一下关于 controller 中我们用到的几个注解。@ControllerController 是 MVC 中的 C —— 控制层,如果不...

2018-02-02 05:48:15 424

RSS订阅器(JAVA)

用JAVA写的RSS订阅器,使用了Spring MVC框架,可在tomcat上运行。

2018-01-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除