sklearn中也包括神经网络算法
- TPOTRegressor
- TPOT自动选择机器学习模型和参数–回归示例
- mlxtend
- 集成学习总结&Stacking利器(mlxtend库)
- statsmodels
- 好用的库(交叉报表)
评价
from sklearn.metrics import classification_report, roc_auc_score
特征处理
# LabelEncoder
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
fit()与fit_transform()
不难看到,只有有信息的转换类的fit方法才实际有用,显然fit方法的主要工作是获取特征信息和目标值信息,在这点上,fit方法和模型训练时的fit方法就能够联系在一起了:都是通过分析特征和目标值,提取有价值的信息,对于转换类来说是某些统计量,对于模型来说可能是特征的权值系数等。另外,只有有监督的转换类的fit和transform方法才需要特征和目标值两个参数。fit方法无用不代表其没实现,而是除合法性校验以外,其并没有对特征和目标值进行任何处理,
fit 返回一个实例,fit_transform 返回和y一样的形状
http://www.cnblogs.com/jasonfreak/p/5448462.html