小白上手深度学习,就等着哭吧

  • 我作为小白挖过的坑

    我并不懒惰,我入门时调查了很多有关机器学习的网站,公式,公式,公式,怎么都是公式,看不懂!怎么办!柳暗花明突然发现scikit-learn,抱着实用主义的方式,不看公式直接开始使用,问题很快就出来了,这些函数的参数是干什么的,为什么要这样设置,参数的范围值和什么有关,一个接一个的问题无法解决,放弃。

    紧接着,又柳暗花明一次,我发现了TensorFlow---- 还是深度学习,厉害啊!然后又开始新的路程,发现完全不知道官方的文档说的是什么,找网站查查,完蛋了,情况好不到哪里,完全不知道大家讲了什么。

    总结:没有任何概念,没有任何基础,没有任何参考,进行此类学习,基本是不可能完成。

  • 罗列问题都来自哪里

1  我为什么看不懂数学公式,我总结原因:根本没有主线,直接搜索数学相关知识,又是课本教学,毫无意义。

2  我为什么根本不明白scikit-learn,TensorFlow,总结原因:本来就没有概念,数学基础又弱。

  • 寻找问题的解决的方向

在“罗列问题都来自哪里”,我发现有三个急需解决的名词,它们分别是: 机器学习算法,神经网络算法,深度学习算法。为了方便大家,让大家不要再纠结,我以最直白的话讲给大家听:

上面三个名词解决的问题,无外乎解决“分类”和“回归”这2件事情。分类大家都应该明白,不做解释。回归,拿浙江《非诚勿扰》栏目举例,女嘉宾为啥对个个男嘉宾,有时灭灯有时亮灯,她们是怎么想的?说明这些女嘉宾心里都有一把尺子在进行度量,度量什么呢?有房能得几分;房子在哪个城市能得几分;房子在城市的哪个位置,能得几分,接下来还有许许多多的类似的度量,例如,车,存款,理想,样子,身高,胖瘦,家庭观等等。一旦掌握了某个女嘉宾的度量标准,那么下一位男嘉宾,一出来自报家门,你都能立刻知道他是否被她灭灯。那么研究这个度量标准,就是回归。

话题拉回来,看下面:

机器学习算法: 通过数学导出公式,然后用代码进行公式实现。

神经网络算法: 就是机器学习算法一种,也有数学公式,只不过用迭代的方式,一次一次接近真实值。

深度学习算法: 就是把神经网络多弄几层,所以有些地方你能看到“深度神经网络”

  • 问题已经解决80%

为什么现在很多人,直接就搞深度学习呢? 上面不是说明白了,机器学习才是基础吗。没错,有了机器学习算法 这基础,你基本上可以看懂80%的数学名词,也基本上可以看懂很多数学公式,包括一些论文了。

      之所以搞深度学习,是因为:

1)有名气,围棋大师都输给机器人啦. 

2)确实在某些领域有强有力的突破。

  •  假如硬要从深度学习开始入手可以吗

可以,但是有2个条件你必须具备:

1)你所在的公司招聘了 厉害的人 ,并且愿意带着你做项目。

2)你准备个3-5万元培训费,这个我就不多说了(注意:那些价格标注“500元以下”的深度学习培训包括视频,都是耍流氓)。

除此外,你还要明白我下面要讲的话(这个是重点,同学们注意画圈,考试必考):

1)除非你有3-5年的工作经验,否则在进行公司面试时机器学习算法,如svm,逻辑回归等,你根本不可能绕过去,也就是说,你完全没有机会进入任何一家公司。

2)深度学习训练,得到最终训练结果少则3个月,多则1年。机器学习算法,一般情况有1-7天足够。你认为什么样的公司会让你什么也不产出,就干耗着时间拿工资?所有多数公司目前仍然是机器学习算法,或者是机器学习算法+深度学习。

3)深度学习训练需要大量的数据,即数据是其燃料,在实际的问题中,我们可能并不会有海量级别的数据,所以公司一般还是用机器学习算法。(完蛋了3-5万培训费白搞事情了,搞得扎心吧)

  • 是真的吗,此话当真?

还有迷糊的,我再举例,附带推荐,让大家别跳坑:

从南大周志华老师的畅销书《机器学习》的目录来看(这本书很多企业团队购买过,想省钱的,自我感觉不错的,推荐购买):

第四章:决策树 
第五章:神经网络 
第六章:支持向量机 
第七章:贝叶斯分类器 
第八章:集成学习 
第九章:聚类 
第十章:降维与度量学习 
第十一章:特征选择与稀疏学习 
第十二章:计算学习理论 
第十三章:半监督学习 
第十四章:概率图模型 
第十五章:规则学习 
第十六章:强化学习

深度学习属于神经网络那一章,只占机器学习领域很小的一块。

从北大章老师视频培训视频《机器学习》的目录来看(我是比较推荐的,普通话的斯坦福教学,手写推导+python实战,数学都能学会):

第七章 支持向量机(SVM)
第八章 AdaBoost算法
第九章 PCA降维算法
第十章 感知器算法
第十一章 BP神经网络算法
第十二章 卷积神经网络

深度学习也仅限于卷积神经网络

  • 总结一下吧
  • 深度学习是 data driven 的,需要大量的数据和时间消耗,而传统的机器学习算法通常不需要;

  • 深度学习本质上可以看作一个特征学习器,在无需另构特征情况下,传统的机器学习算法已经能够胜任日常的任务;

  • 如无必要,勿增实体。能够简单的模型解决的,不必要上深度学习算法,杀鸡焉用牛刀?

不懂行的、入门的,不要,不要,不要,(说三遍)不要搞深度学习,从机器学习开始,否则你会哭


阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页