数据科学-机器学习
机器学习理论和实践内容传播
ZZ邀你聊数科
致力于分享最新、最热、最实用的数据科学理论和实践内容,将以下里巴人的风格阐述阳春白雪般的数据科学知识。
展开
-
监督学习(2)|本质是分类的“逻辑回归”
1. 引言 机器学习,绕不开预测问题,预测绕不开回归和分类。本篇介绍最常用的二分类算法:逻辑回归(Logistics Regression),当然随着算法的发展,它也可用于多分类问题。每一个算法都是许许多多数学家的努力铸就,理论篇希望自己可以尽量将算法发展过程叙述的平滑一些,可以即保留理论基础,又让读者感觉舒服。下面,就让我们一起来领教一下这处理问题的伟大逻辑。 2. 回归到分类的过渡 逻辑回归,顾名思义,分为两部分:逻辑和回归。 首先让我们回忆一下上一篇线性回归的内容。 我们希望透过样本得到数据背后的本质原创 2020-12-09 20:34:04 · 114 阅读 · 0 评论 -
监督学习(1)|一文搞懂线性回归,lasso回归,岭回归
1.引言 机器学习三大主要分支:监督学习、无监督学习和半监督学习。 对于监督学习,根据目标数据类型的不同分为二大核心任务:分类和回归。 其中分类指目标数据为离散型变量,回归指目标数据为连续型变量。 对于回归分析方法,本文主要介绍在实际应用最广泛的线性回归分析。之后也会分享对应的实践案例(Python和R)。 2. 简洁的本质 借用“科普中国”科学百科词条中的定义: 回归分析是确定两种或两种以上变量关系的一种统计分析方法。 所谓透过现象看本质,我们希望对观察到的现象,经过统计分析,可以洞悉现象背后客观存在原创 2020-12-06 13:03:21 · 432 阅读 · 0 评论 -
数据科学总纲:欲练此功,必过此纲
大家好,我是ZZ,目前在网易担任数据分析师。欢迎大家来到我的个人专栏。 知之为知之,不知为不知,是知乎。虽然知乎目前水化现象严重,但仍然是知识分享最好的平台。 创建这个专栏主要有三个目的: 一是将自己多年来对数据科学知识的一点理解进行总结,并且以通俗易懂的语言呈现给读者,以便大家学习。 二是结合自身工作经历,对未来想从事数据科学工作的同学提供一个成本最小的路径,以便大家及时的找准方向并为之努力。 三是希望通过这个专栏,吸引更多的同道中人,或者说,寻找到和我一样有趣的灵魂。 这篇文章的主要目的就是原创 2020-12-05 17:14:56 · 133 阅读 · 1 评论