- 博客(4)
- 收藏
- 关注
原创 【机器学习要点记录】知识点
1、为什么做归一化/标准化?归一化对数据进行移动,但不改变数据分布,标准化使数据符合某种分布,改变了数据分布。做归一化/标准化是因为某些特征量纲差别大,做了归一化/标准化可以加速求解。需要做归一化/标准化的算法:涉及距离计算的算法,如KNN、KMEANS,用梯度下降求解的算法,如逻辑回归。哪些算法不需要归一化/标准化:树形结构,如决策树和随机森林,因为他们关注的不是数据的值,而是数据的分布和概率,对数据缩放不影响分裂点的位置。2、有监督和无监督的区别。一个有label一个没有l.
2020-10-15 16:14:24 254
原创 【机器学习要点记录】画图模板
f,ax = plt.subplots(figsize=(15,15))ax = sns.heatmap(data.corr(), annot=True, cmap = 'viridis', linewidths = .1, linecolor = 'grey', fmt=".2f")ax.set_title("Correlation")plt.show()
2020-10-13 11:12:51 367
原创 【机器学习要点记录】metrics.roc_auc_score:使用 model.predict() 和 model.predict_proba() 效果差别很大
以前使用roc_auc_score都是用model.predict()的预测结果,错了那么久。。。。。。查看官网注释才知道应该用model.predict_proba()的预测结果。做了个对比试验,分别使用model.predict() 和 model.predict_proba()的预测结果,观察AUC值发现,相比于使用model.predict_proba()的AUC值,使用model.predict()的AUC值偏小。...
2020-10-13 11:06:58 1684 5
原创 【机器学习要点记录】实用代码
总是想不起来怎么查找,这里记录一下sklearn.metrics.SCORERS.keys()dict_keys(['explained_variance', 'r2', 'max_error', 'neg_median_absolute_error', 'neg_mean_absolute_error', 'neg_mean_squared_error', 'neg_mean_squared_log_error', 'neg_root_mean_squared_error', 'neg_mea
2020-10-13 10:22:57 219
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人