这里借知乎用户的几句对Jupyter notebook评价:
我很喜欢Jupyter,使用的过程就好比拿纸和笔,还有计算器做数学演算. 而且可以把草稿轻松擦掉。比如,要写个小Paper,完全可以用Jupyter来做,代码和论述完美的结合了,而且直接还能跑起来。弄完之后,把乱糟糟的Cell直接卡嚓掉,然后to pdf,就是一篇paper了。
Jupyter原名Python notebook,是一个在浏览器上编辑的Python开发环境,用他来做数据挖据将会给你带来全新的开发体验。
Jupyter支持cell运行,markdown,letex,还可以很方便的分享给别人。
Spyder 也是很优秀的python开发编译环境,也支持cell内运行,虽说没有notebook美观,没有发布分享功能,但整体界面简洁,功能全,也非常适合python开发。特别的,支持debug调试和ipython交互式界面。
一、安装环境
安装工具介绍:
用python做数据挖掘一般需要用到如下几个基础工具包:
- numpy 数组 ,使用较为简单,可以做任何数组或矩阵操作,因为numpy基于C语言,所以运行速度比pandas快不止一点点
- pandas (重点) Series和DataFrame使用率极高,period和timeStamp在处理时间序列问题也常用
- sklearn (重点) 内置了机器学习用到的大部分算法,还有预处理、特征工程、测试非常多有用的函数,难点是现在还没有中文说明文档参考学习
- scipy 包含各种数学计算公式
- statsmodel 统计学分析,包含时间序