大家好,我是连续2届全国Datathon数据分析大赛亚军向瑶函,同时也是一名0基础转行机器学习领域的文科生,上面这些描述并不是夸张,可以看下面,有图有真相。
今天想跟大家分享一下我在机器学习领域最常用的工具,之所以会想到这次分享,主要还是给同样0基础想转行机器学习的小伙伴提供一个思路。
毕竟工欲善其事必先利其器嘛,相信没有哪个人会希望在机器学习的时候被环境配置、工具兼容性、依赖库这种“解决完没啥成长,但是不解决又没法推进”的问题劝退。
由于我是一个0基础转行机器学习的文科生,因此我选择工具更多是出于简单、学习成本低、性价比高这些角度,如果阅读文章的您是那种机器学习大神,想要追求在高性能、协作开发、虚拟环境管理等板块更强大的工具,那这篇文章列举的工具可能更多仅供参考了。
一、Python环境:anaconda(你可以说它臃肿,但没法否认它是最简单的)
一般我们这种转行做机器学习,除非是那种究极大佬会愿意去用C++改经典库比如tensorflow的底层代码,95%的人首选语言都是Python。
而比起直接到Python官网下载一个只附带了官方库的Python纯净版,我更推荐大家去下载anaconda(国内网可以直连)。
如果你做过一段时间机器学习,或者是纯粹搞数据分析,你会觉得它很臃肿,因为它除了numpy、pandas等最基础的“数据分析四剑客”,以及超级实用的Jupyter Notebook外,如下图所示,anaconda还附加了很多乱七八糟可能你永远都用不到的库。