Python scikit-learn 学习笔记—环境篇
近来闲来无事,也面临毕业季。这段时间除了做毕业设计,和同学再多吃几顿饭玩玩游戏之外。剩下的时间浪费着实可惜。想着以后研究生还要读三年,不如现在多看看书或者别的资料。正逢最近参加阿里巴巴大数据比赛,趁机学了一阵Python 数据挖掘包scikit learn,估计以后说不定会用到,所以先行记录下来,分享给大家。
先说一下这段时间对sklearn的理解。这一个数据挖掘包给我最直观的感觉就是简易。这个挖掘包的一些算法核心编码部分是借鉴别的单独算法包(例如我看SVM部分是应用的LIBSVM or LIBLINEAR)这样的速度也是非常快。Python语言一种简单易学的语言。所以想必也非常容易上手,实现起来很容易。另外sklearn的文档非常齐全,我们可以通过里面的example先去直观的理解算法的实现而将比较难的数学原理放在后面再去深入学习。因此我觉得这个包很适合新手去接触。