1.scikit-learn
scikit-learn 0.16 分为6大类,分别为:
- Classification 分类
- 应用:Spam detection 垃圾邮件检测, Image recognition 图像识别
- 算法:SVM, 最近邻,随机森林……
- Regression 回归
- 应用:Drug response 药物反应,Stock prices 股票价格
- 算法:SVR,ridge regression,Lasso……
- lustering 聚类
- 应用:客户细分,分组实验结果
- k-Means,spectral clustering(谱聚类),mean-shift(均值漂移)
- Dimensionality reduction 降维
- 应用:Visualization(可视化),Increased efficiency(提高效率)
- 算法 : PCA,feature selection(特征选择),NMF等
- Model selection 模式选择
- 目标: 通过参数调整提高精度
- 模块: grid search(网格搜索),cross validation( 交叉验证),metrics(度量)
- Preprocessing 预处理
- 应用:转换输入数据
- 模块:preprocessing,feature extraction
2.scikit-learn 安装包模块
- __check_build
- cluster 聚类
- covariance 协方差
- cross_decomposition 交叉降维
- datasets 数据集
- decomposition 降维
- ensemble 集成学习
- externals 模型持久化
- feature_extraction 特征提取
- feature_selection 特征选择
- gaussian_process 高斯过程
- linear_model 线性模型
- manifold 流形学习
- metrics 度量
- mixture 混合
- neighbors 邻居
- neural_network 神经网络
- preprocessing 预处理
- semi_supervised 半监督学习
- svm
- tests 测试
- tree 决策树
- utils