scikit-learn机器学习
贫僧不懂
这个作者很懒,什么都没留下…
展开
-
3.sklearn—聚类分析详解(聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、卡方距离、二值变量距离、余弦相似度、皮尔森相关系数、最远(近)距离、重心距离)
聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、切比雪夫距离、卡方距离、二值变量距离、Jaccard距离、余弦相似度、汉明距离、皮尔森相关系数、最远(近)距离、重心距离、ward方法(离差平方和距离)、组间平均链锁距离、组内平均链锁距离;原创 2019-01-25 17:19:01 · 11902 阅读 · 2 评论 -
1.关于scikit-learn简介
说明:这个sklearn系列的笔记,在我的分类scikit-learn里面,主要介绍常用的模型的参数,并且附带数据、案例、代码、结果。这个系列的笔记不会限于sklearn,还会包括一些时间序列(StatsModels)、词云(jieba & wordcloud)、LDA(NLP的最最最简单部分)。笔记整理自一下书目(同时推荐这些书,书中有交叉知识,我个人比较喜欢第一本):张良均,王...原创 2019-01-22 12:59:46 · 745 阅读 · 0 评论 -
4.sklearn—kmeans参数、及案例(数据+代码+结果)
完整的案例,数据+代码+加注释+结果。详细!原创 2019-01-28 19:46:44 · 43287 阅读 · 13 评论 -
2.sklearn—评价指标大全(平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、结构风险最小)
平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、经验风险最小、结构风险最小原创 2019-01-23 17:27:13 · 33987 阅读 · 8 评论 -
5.sklearn之转换器(划分训练集和测试集、以及标准化、归一化数据会用transform,独热编码也会用到)
在sklearn中划分训练集和测试集、以及标准化、归一化数据原创 2019-01-29 17:04:19 · 4823 阅读 · 1 评论 -
6.sklearn(机器学习)—简介分类和回归
现在的机器学习这么火,无论是推荐算法还是预测模型。本质上无非就是回归与分类两个问题。回归问题离不开均方误差,分类问题离不开距离公式、混淆矩阵、损失函数。本文简介常用的回归和分类算法。原创 2019-01-30 18:11:04 · 684 阅读 · 0 评论 -
7.关于ADASYN使用中出现两种类型的报错
1.在使用ADASYN自适应综合过采样处理不平衡数据的时候遇到一个错误: No samples will be generated with the provided ratio settings.2.TypeError:fit_resample() missing 1 required positional argument: 'y'原创 2019-03-05 18:18:17 · 1855 阅读 · 0 评论 -
8.关于python里面的混淆矩阵(confusion_matrix)排列问题,与教科书、R语言、SPSS都反着的!!!
python里面的混淆矩阵(confusion_matrix)排列问题,true 和 predict 的位置是反着的,并且positive 和negative也反着排列的!!!与教科书、R语言、SPSS都反着的!!!如果是从R转过来使用python的话,这个小偏差会造成巨大巨大巨大的损失!原创 2019-03-08 14:06:35 · 2920 阅读 · 1 评论 -
9.sklearn——logistic regression 参数解释 及 案例
sklearn logistic regression;参数;案例;混淆矩阵。原创 2019-05-31 17:40:10 · 10108 阅读 · 0 评论