本文只是一篇类似导向性的分享, 并没有原创内容, 主要是书籍和网络资源的整理, 仅供参考. 可能会有后续补充更新.
资源
A Byte of Python 这是给没有使用过 Python 的人员的入门级材料, 如果有编程基础的话应当一两天就可以上手了.
- Python for Data Analysis
Python for Finance 2015年的新书, 相比前者, 也涵盖了基础的介绍, 适合初学.
Python for Data Analysis 这本书介绍的生态已经非常详尽了, 以下是一些补充. 只是给定关键词, 有兴趣的可以进一步查阅资料.
对其他数据分析语言的用户的友好文档
集成生态的发布版本
科学计算的生态, 一个个安装起来也未必省心, 尤其是 Windows, 有集成了诸如 Numpy, Scipy 等库的第三方发布版本.比如 Anaconda
开发 / 研究工具
IPython notebook : 相当于 RStudio 中 Rmd 的编辑和运行的模式, 不过个人认为使用起来更加方便.
Pycharm : 更加贴近开发的 IDE.
Spyder : 更加接近 Matlab 环境的开发.
IPython Notebook
IPython Notebook - a web-based interactive computational environment
Minibook
外面已经有电子版的了, 里面的内容也涵盖了基本的 numpy 及其科学计算生态的简单介绍. 非常推荐 入门学习.
Cookbook
暂时还没有找到电子资源, 好在网站本身也开放了大量示例, 也是很好的学习资源.
有好的资源欢迎分享
性能提升
Python 的数据工具的底层已经做了相当的优化, 除非是生产环境对性能要求非常苛刻, 一般也很少使用, 可以不多做考虑.
Cython : Cython is an optimising static compiler for both the Python programming language and the extended Cython programming language (based on Pyrex). 瓶颈的内容可以使用 Cython 配合 C/C++ 做模块替换.
Pypy : PyPy is a fast, compliant alternative implementation of the Python language. 是 Python 语法的替换实现, 但是对于 Numpy 生态的支持还不属于稳定阶段.
数据存储
HDF5
HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data.
Pandas 有对 hdf5 格式数据的支持.
TODO
相关资源的链接完善
教程文档/视频的列举
例子的给定
更新历史
- 2015-02-20 添加了 IPython Notebook 和 Python for Finance 的相关学习资源
- 2015-02-05 添加对其他数据分析语言的用户的友好文档
- 2015-01-31 创建