自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ZSY的大后台

心有所适,随遇而安

  • 博客(10)
  • 收藏
  • 关注

原创 笔记-GridSearchCV

机器学习的“炼丹”(调参)过程是一个十分痛苦的过程。一方面很多数据特性不能人为解释,另一方面我们对于调用的算法库并不十分了解。导致调参过程具有一定的玄学性。当缺乏理论指导时,对参数的任意设置可能带来意想不到的效果,而这种设置又是拍脑袋拍出来的,所以需要一种方法,来搭配不同的参数来测试模型。sklearn中的GrdiSearchCV就具有这样的作用,给定参数列表,它会自由组合众多参数,对模型进行测试,

2017-11-30 14:50:50 473

原创 笔记-Tukey Method发现outliers(离群点)

在大规模数据集中,由于噪声、扰动、采样过程误差等等原因,会出现一些数据点偏移整个数据集。假想整个数据集由某未知分布生成,则这些点可以看做该未知分布下的噪声采样。在可视化情况下,这些点显著偏移了数据集的点群,故称为离群点。而众多机器学习算法对数据分布都存在着一定的假设或期待数据集较为“规整”。因此在数据挖掘中,常需要在预处理中去除该类点,让算法能更好地发现“正常”数据间存在的关系。Tukey Meth

2017-11-30 14:31:58 3440

原创 笔记-梯度下降

Gradient Descent(梯度下降)作为机器学习中求解目标(损失)函数最值的方法,迭代求解速度快,逻辑清晰。学习中参考链接如下:深入梯度下降(Gradient Descent)算法 - ooon - 博客园

2017-11-30 14:21:47 293

原创 笔记-SVM

SVM(支持向量机)在深度学习算法崛起前是机器学习中最强大的算法,可以应用在分类与回归问题上,具有诸多优势。学习时建议先阅读周志华西瓜书相关部分,而后参考一些博客。若想要有更深入的理解,可以观看斯坦福大学机器学习cs229中SVM部分。参考链接如下:该博主关于SVM算法的系列文章讲解十分详细: 机器学习算法与Python实践之(二)支持向量机(SVM)初级

2017-11-30 14:16:26 333

原创 笔记-SVD&PCA

SVD(奇异值分解)能够提取出最能代表一个矩阵的“特征方向”,在机器学习中最为重要的应用是PCA(主成分分析)。周志华西瓜书中讲得较为详细,结合以下参考链接可以有一个较好的理解。在同类型博客中笔记-矩阵与特征值给出的知乎问题链接下,某回答很好地解释了矩阵分解在PCA中的应用,十分具有参考性。机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用 - LeftNotEasy - 博客园奇异值分

2017-11-30 14:05:16 306

原创 笔记-矩阵与特征值

线性代数是机器学习数学基础中最重要的一环。矩阵作为线性代数中最基本、使用最广泛的概念,理解它的数学意义对建模是十分有帮助的。而特征值是描述矩阵的重要指标。知乎上对于矩阵问题的讨论十分具有参考性,各答主从不同角度,用浅显易懂的方式进行了讲解:(1 封私信 / 11 条消息)如何理解矩阵特征值? - 知乎

2017-11-30 13:57:48 382

原创 笔记-L1、L2范数理解

L1、L2范数是解决机器学习问题中模型过拟合的典型方法,在模型参数空间进行限制,是机器学习建模逻辑中重要的一环。学习过程中参考链接如下(周志华西瓜书也讲得很详细):机器学习中的范数规则化之(一)L0、L1与L2范数 - zouxy09的专栏 - CSDN博客(1 封私信 / 9 条消息)0 范数、1 范数、2 范数有什么区别? - 知乎正则化方法:L1和L2 regularization、数据集扩增

2017-11-30 13:50:06 589

原创 kaggle-House Price Prediction

房价预测问题,kaggle回归类入门题。做该比赛时,参考链接如下:数据分析: Comprehensive data exploration with Python | Kaggle正则化线性模型: Regularized Linear Models | Kaggle

2017-11-30 13:43:44 1618

原创 kaggle-Digit Recognition(手写数字识别)

DR(手写数字识别)问题是多分类问题的入门题目,可以采用多种机器学习方法进行求解。同时由于是图像类问题,可以使用CNN(卷积神经网络)求解。列出做该比赛时的参考链接:Digit Recognition【机器学习算法实现】logistic回归__基于Python和Numpy函数库 - wepon的专栏 - 博客频道 - CSDN.NETKaggle入门——使用scikit-learn解决DigitRe

2017-11-30 13:40:42 659

原创 kaggle-Titanic

kaggle入门题——Titanic。给出写代码时参考的notebook:传送门

2017-11-30 13:34:06 369

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除