PRML学习心得
文章平均质量分 85
bjy_fighting
一个深爱coding与机器学习的电气男
展开
-
PRML学习心得:Chapter1—Introduction
PRML学习心得:Chapter1—Introduction本章主要介绍了机器学习的3种重要理论:概率理论(Probability Theory)、决策理论(Decision Theory)以及信息学理论(Information Theory),并根据多项式曲线拟合这一实例引出了解决机器学习的一般流程,包括模型选择(Model Selection)、过拟合(overfitting)以及维度灾难等问题原创 2016-01-17 16:11:38 · 944 阅读 · 0 评论 -
PRML学习总结之2------概率分布之一
PRML学习总结之2——概率分布之一 本章主要介绍一些重要的概率分布,包括伯努利分布与二项分布,多项式分布,Beta分布,Dirichlet分布以及Gaussian分布。其中详细介绍了Gaussian分布。同时 介绍了指数家族(The Exponential Family)的一些性质。最后介绍了两种无参数的方法:核密度估计以及KNN。基本的知识1.先验分布(prior distribution)原创 2016-01-21 23:04:36 · 750 阅读 · 0 评论 -
PRML学习总结之三-----概率分布之二
PRML学习总结之三—–概率分布之二这一部分主要介绍机器学习之中的重要分布:高斯分布(Gaussian Distribution),高斯分布贯穿整个机器学习中的各个部分。本文主要介绍2维、3维高斯分布的特点及性质。高斯分布的表达式二维高斯:N(x|μ,σ2)=1(2πσ2)1/2exp{−12σ2(x−μ)2}N(x|\mu, \sigma^2) = \frac{1}{(2\pi\sigma^2)^原创 2016-02-18 18:57:35 · 1272 阅读 · 0 评论 -
非参方法-K NearestNeighbor(KNN)
非参方法-K NearestNeighbor(KNN)KNN方法作为一种无参方法,使用起来十分简单,方便。更为重要的是它往往能够得到很好的效果。它既可以应用到分类中,也可以应用到回归中,是一种十分重要的方法。问题:给定一组训练数据(X1,y1),(X2,y2),...(XN,yN)(X_1, y_1), (X_2, y_2),...(X_N, y_N), 同时又给定了预测样本XtX_t, 求取相对应原创 2016-02-27 17:04:44 · 1333 阅读 · 0 评论 -
Kaggle Animal Shelter Outcome整个流程
本文主要对Kaggle的一个比赛项目,进行了分析说明,希望能够查找到原因,提高数据分析的能力。具体项目要求及数据请看[这里]简而言之这是一个多分类的问题,并需要计算出属于各个类的概率,项目评判的标准是交叉熵(Cross Entropy)最小。1、数据的加载与清洗由于所给数据为csv格式,而且还有header选择使用了pandas中的read_csv函数作为加载数据的函数,具体代码如下:animals原创 2016-08-09 18:34:49 · 1368 阅读 · 1 评论