环境还有jupyter notebook
Anaconda
https://www.anaconda.com/download/
anaconda 集成了很多环境 如上图蓝色部分
Numpy
官网:http://www.numpy.org/
SciPy
Scipy系数矩阵(Sparse Matrices)
以稀疏存储的方式 即只存 一个样本 特征的位置和他对应的值(没有值的特征不管)
Pandas
Matplotlib 官网:http://matplotlib.org/ 掌握有点复杂
上面图像的意思是 拿数据的一个特征(维度)分析 看不同的值所占的百分比 其中这个特征
值为200的数据的比例最高。
Seaborn 官网: https://seaborn.pydata.org/ 比matplotlib 简单
Scikit-Learn 功能强大 使用方便啊~
—Machine Learning in Python
基本功能有六个部分:
分类(Classification)、
回归(Regression)、
聚类(Clustering)、
数据降维( Dimensionality reduction )、
模型选择(Model Selection)、
数据预处理(Preprocessing)
优点
各种机器学习模型有统一的接口
• 模型既有默认参数,也提供多种参数调优方法
• 卓越的文档
• 丰富的随附任务功能集合
• 活跃的社区提供开发和支持