- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 数据科学总纲:欲练此功,必过此纲
大家好,我是ZZ,目前在网易担任数据分析师。欢迎大家来到我的个人专栏。 知之为知之,不知为不知,是知乎。虽然知乎目前水化现象严重,但仍然是知识分享最好的平台。 创建这个专栏主要有三个目的: 一是将自己多年来对数据科学知识的一点理解进行总结,并且以通俗易懂的语言呈现给读者,以便大家学习。 二是结合自身工作经历,对未来想从事数据科学工作的同学提供一个成本最小的路径,以便大家及时的找准方向并为之努力。 三是希望通过这个专栏,吸引更多的同道中人,或者说,寻找到和我一样有趣的灵魂。 这篇文章的主要目的就是
2020-12-05 17:14:56 181 1
原创 监督学习(2)|本质是分类的“逻辑回归”
1. 引言 机器学习,绕不开预测问题,预测绕不开回归和分类。本篇介绍最常用的二分类算法:逻辑回归(Logistics Regression),当然随着算法的发展,它也可用于多分类问题。每一个算法都是许许多多数学家的努力铸就,理论篇希望自己可以尽量将算法发展过程叙述的平滑一些,可以即保留理论基础,又让读者感觉舒服。下面,就让我们一起来领教一下这处理问题的伟大逻辑。 2. 回归到分类的过渡 逻辑回归,顾名思义,分为两部分:逻辑和回归。 首先让我们回忆一下上一篇线性回归的内容。 我们希望透过样本得到数据背后的本质
2020-12-09 20:34:04 127
原创 监督学习(1)|一文搞懂线性回归,lasso回归,岭回归
1.引言 机器学习三大主要分支:监督学习、无监督学习和半监督学习。 对于监督学习,根据目标数据类型的不同分为二大核心任务:分类和回归。 其中分类指目标数据为离散型变量,回归指目标数据为连续型变量。 对于回归分析方法,本文主要介绍在实际应用最广泛的线性回归分析。之后也会分享对应的实践案例(Python和R)。 2. 简洁的本质 借用“科普中国”科学百科词条中的定义: 回归分析是确定两种或两种以上变量关系的一种统计分析方法。 所谓透过现象看本质,我们希望对观察到的现象,经过统计分析,可以洞悉现象背后客观存在
2020-12-06 13:03:21 492
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人