说明:这个sklearn系列的笔记,在我的分类scikit-learn里面,主要介绍常用的模型的参数,并且附带数据、案例、代码、结果。
这个系列的笔记不会限于sklearn,还会包括一些时间序列(StatsModels)、词云(jieba & wordcloud)、LDA(NLP的最最最简单部分)。
笔记整理自一下书目(同时推荐这些书,书中有交叉知识,我个人比较喜欢第一本):
- 张良均,王路,谭立云,苏剑林等.Python数据分析与挖掘实战[M].北京:机械工业出版社,2017.
- 王宏志.大数据分析原理与实践[M].北京:机械工业出版社,2017.
- 余本国.基于python的大数据分析基础及实战[M].北京:中国水利水电出版社,2018.
第一本书附带数据、代码、结果,学起来可以实地搬砖操作,真的很方便;第二本书理论完善、附带案例展示,但是没有数据、没有代码,可以看看,培养下数据思想;第三本书,也有案例数据代码,但是内容比较简单,而且我看着有点乱(仅个人观点)。
文章目录
1.python数据分析的几个工具
库名 | 说明 |
---|---|
Numpy | 数组支持,以及高效的函数,很重要!!! |
Scipy | <