Linux系统让我的机器学习之路如虎添翼

最早接触linux是在高中的时候,那个时候基本什么也不懂,每次闲下来的时候,都跑去网吧玩游戏,由于零花钱有限,后来就想了很多外门邪道,平时有去黑客论坛的习惯,无意间就接触了linux,那时候感觉很神奇,在一个黑色的框框里,疯狂敲键盘,也是在那个时候学会了如何破解网吧管理系统,从此上网不在花钱了,哈哈哈。那个时候也就是接触了一下linux,根本没有去深入学习和研究。




上大学以后也是断断续续的学习linux,用到的时候看一点,并没有深入的学习,真正的接触linux还是要从学习机器学习的时候开始的。机器学习的门槛有点高,并不是一两天就能学会的。当时看了很多资料,都不能很好的理解,特别是一大堆的线性代数和概率论,这些学完之后早就忘记了,所以大部分都很难读懂,就这样没有规律的学习了一段时间,后来发现,这样效率非常低,看了很多之后还是没有理解机器学习,所以就下定决心从头一点一点的恶补基础知识。


首先从最基础的数学开始学起,我经常问自己:如果我想要更好地学习机器学习,我该怎么做,但我不知道我想学什么?有经验的人告诉我:很好的问题!我的答案是:始终如一地通过教科书。所以我一点一点的复习线性代数和概率论,这不是简单的复习大学所学的简单的线性代数和概率论,而是我们程序员所需要的线性代数和概率论。从中我理解到:近年来为了更好的进行数据处理,特别是大规模的数据处理。人们开始在各个学科中应用概率论统计。不管是数据挖掘,文档的自动归类,非法使用的鉴别还是垃圾邮件的自动筛选,还有语音识别和机器视觉,这些东西都需要概率论的理论支持。通过一段时间的学习,知道了多个随机变量之间的关系,离散值的概率分布,连续值得概率分布,协方差矩阵,多元正太分布,估计和检验,伪随机数等各种理论与实际代码编写的实现。


     线性代数和概率论我恶补的差不多之后,我开始学习数据统计,数据统计学习的时间比较漫长,内容稍微有点多,最后大概是熟练掌握了spss之后,自我感觉能时间上手的时候,我就结束学习数据统计了。这个可以一直学习,不用一下子全都弄懂。


     在这些都学习的差不多之后,开始重读一些以前看不懂的书籍,看到理论知识并不在那么的害怕他们,开始会自己一步一步的推导,直到结果成立。后来实际做项目,更加深了我对之前理解,拿一个普通的项目来说说吧。凯普斯通项目:使用一个数据集看看你是否可以预测给定的所有其他属性的食品评分。使用三种不同的机器学习技术来完成这个任务,并证明你的首选。此外,建立一个分类器,预测审查是“好”还是“坏” - 你应该使用合理的“好/坏”门槛。这将测试你的数据驱动能力,分析更大数据集的策略,机器学习技术知识以及在R中编写分析代码的能力。按照之后的经验,就只会比着书上的代码编写,现在可以真正的理解为什么要这么做。最后介绍一下,如何实现。实现你代码的部署,首先要掌握linux系统如何操作。这个以前的时候并没有认真学习过。趁着这个机会。我就认认真真的学习了一下linux。我从网上搜了很多资料。包括书籍和视频,做了详细的对比,最终我选择了《Linux就该这么学》这本书。它让我从一个小白,变成了一个熟练操作linux的人。




现在来说一下,学习过linux之后对操作系统的见解吧。


  Linux在1991年问世,话说那个时候我还没有出生呢,相较于windows系统,linux系统功能强大,上手之后操作十分方便,结构十分清晰,最大的特点就是开源,以致于短短几年的时候发展如此迅速。因此成为很多科研机构,学生老师的学习对象,还有学校目前已经开设了linux教程,可见linux系统的影响性之大。现在linux系统已经成为当今最流行的操作系统了,相较于windows,虽然windows上手快,简单易学,但是对于科研工作者,许多功能,操作非常不方便,而且很多制图,仿真软件只能在linux或者unix系统下才能运行,因此很多公司推出了许多linux软件,使得linux向商业化趋势发展。


     说了这么多,来总结一下,要学习一门新知识,并不是笼统的比着人家写写看看就行了,要从根上解决,找一本书从头到尾的研究透,这才是王道。

阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页