python要装多少包,这个要取决于你用python做什么工作了,基本上,在每一个应用方向都有专业的包。
python自带了许多功能强大的包,比如:爬虫包urllib,正则表达式包re,计算包collections,还有图形包tkinter等等,这些包在你安装python的时候就已经自动安装了,当然,这都是基础的包,我们日常用到的更多的是第三方包,因为第三方包功能更为强大。
作为数据挖掘人员,我先说一下日常用到的框架或者说模块。
python本来自身是没有很好的数据处理能力的,因为的他的基本数据结构就是那几种,列表,字典,集合,元组等,无法使用到高维数组,更没有提供矩阵运算的能力,但是!第三方库numpy的出现,使python具备了处理数据和矩阵的能力,然后在此基础上,出现更友好的处理数据的库,scipy,pandas,这些都是基于numpy库而来的,当然还有机器学习库scikit-learn,这个模块提供了强大的全面的机器学习算法,而且接口相对十分简单,让数学或者统计学工作者能很快上手。
所以,一个数据挖掘人员,日常使用就是这些:numpy,scipy,pandas,scikit-learn,还有数据可视化包matplotlib,这些日常处理数据,构建模型,结果可视化必备的工具。
但是这么多包,他们之间又有相互依赖,一个个的安装是个大问题,这里推荐安装anaconda,python的科学计算版本,自带