![](https://img-blog.csdnimg.cn/20190918140213434.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
python机器学习 - 用python深入机器学习的世界
掌握python机器学习库包scipy,numpy,pandas,scikit learn,matplotlib等的使用,关注如何使用python具体实现基础的算法模型及解决相应的机器学习问题
这个学习阶段的参考资料为python machine learning
ZachhhBweg
时间宝贵,不多哔哔
展开
-
词袋模型(bag-of-words)--- python自然语言处理基础
文章目录词袋模型词袋模型原创 2020-05-05 18:29:35 · 2653 阅读 · 0 评论 -
python机器学习 - 走进集成学习的世界(装袋法 - bagging,自适应增强 - adaptive boosting)
文章目录集成学习,who are you?多数投票集成学习,要你何用?source:python machine learning 3rd集成学习是机器学习领域相当重要的一个概念,本篇文章中所关注的集成学习就是使用多个模型,采用同一训练集进行训练后,对样本运行多数投票的方式来确定分类,如果你不关注多数投票而是渴求更加高深莫测的算法,那么这盘基础性的文章将不值得你花费时间集成学习,who ar...原创 2020-04-19 18:01:02 · 860 阅读 · 0 评论 -
一篇文章总结python机器学习类不平衡问题的处理-class imbalance(ROC,混淆矩阵,f1 score等)
文章目录迷惑矩阵准确度,召回率和f1 scoreROC多类分类问题-加权均分其它方法迷惑矩阵准确度,召回率和f1 scoreROC多类分类问题-加权均分其它方法原创 2020-04-15 16:19:07 · 1067 阅读 · 0 评论 -
一篇简明的python机器学习模型评估与超参数调试基础总结(交叉验证,学习曲线,网格搜索等)
文章目录交叉验证交叉验证原理选择Kpython实现分层交叉验证source:python machine learning 3rd高方差和高偏置是机器学习碰到的常见问题,而在高方差及高偏置之间寻找一个平衡点从而对模型进行准确的预测涉及到了我们对模型的评估(找到问题)和对超参数的调整(解决问题),其中最典型的超参数就是正则系数λ\lambdaλ,它的大小直接影响了模型在高方差和高偏置之间的表现。...原创 2020-04-13 18:06:01 · 1005 阅读 · 1 评论 -
简明KPCA及其python实现(核主成分分析)
文章目录KPCAKPCA, PCA与LDA核心方程RBF KPCApython实现KPCAsource:python machine learning 3rdKPCA核主成分分析-kernel principal component analysis,是一种用于非线性分类的降维工具,实现非线性映射降维右图维典型的非线性分类问题KPCA, PCA与LDAPCA:主要用于线性非监督学习...原创 2020-04-07 22:33:14 · 12783 阅读 · 6 评论 -
线性判别分析LDA(linear discriminant analysis)与二次判别分析QDA(quadratic discriminant analysis)
文章目录LDA与PCALDA python实现Source: Python Machine Learning 3rdLDA与PCALDA和PCA都用于数据维度降低LDA可以视为比PCA高级的分类技巧,但在实践情况下,使用PCA比使用LDA在图像识别等领域表现更好LDA用于监督学习,而PCA用于非监督学习PCA寻找最大方差的正交分量轴,LDA寻找优化分类的特征子空间LDA pyt...原创 2020-04-06 10:50:54 · 2262 阅读 · 0 评论 -
主成分分析-python机器学习实现(PCA)
文章目录numpy + pandas实现1. 标准化原始数据集2. 获得协方差矩阵3. 获得特征向量和特征值4. 按照特征值降序排列相应的特征向量5. 选择k个特征值最大的特征向量6. 获得k维矩阵,W7. 使用W实现维度转换sickit-learn直接实现代码思路来自Python Machine Learning 3rd,本人只是做了一些修改numpy + pandas实现我们以panda...原创 2020-04-01 17:39:03 · 1306 阅读 · 1 评论 -
python实现SBS(sequential backward selection)
文章目录什么是SBSSBS原理源码结语什么是SBSSBS是减少数据维度的最佳解决方案,它能够实现将数据的特征维度从m降到k的功能SBS原理降低一个维度,使用剩下的维度进行预测,获得结果分数重置维度,重复第一步,其中降低另一个维度,直到获得了所有的降低其中一个维度获得的分数选择第二步中得分最高的组合检查当前数据维度k是否等于目标维度,如果等于,当前特征组合则为目标特征组合,否则从第一...原创 2020-03-31 12:57:58 · 1597 阅读 · 0 评论 -
棒棒的二维数据可视化分类模型
文章目录源码优势局限代码实现原理预处理创建标记和颜色生成器确定坐标轴数据范围基于数据范围创建网格坐标获得预测机器网格坐标绘制绘制等高线图绘制样本分布散点图高亮测试集示例SVM最大边界设定截止参数的SVM源码源码来自Python Machine Learning 3rd,Chapter 3,自己加入了一些理解和修改优势适用于大多数分类算法模型,对不同参数的统一模型都能够绘制出不同的决策边界...原创 2020-03-29 13:22:13 · 1566 阅读 · 0 评论 -
python实现SGD(stochastic gradient descent)算法
文章目录源码知识点1. 实现参数(权重)矩阵初始化小值:2. 打乱数据3. 实现随机梯度下降4. 使用函数实现数据处理步骤5. 在保持初始化后权重不变的情况下实现训练6. 返回自己结果源码此为适应机使用随机梯度下降的python实现,代码主要来源于Python Machine Learning 3rd(此书包含大量python实现算法的源码,宜啃读)自己把代码又弄了一遍,欢迎想看或者看过这本...原创 2020-03-25 18:14:26 · 6657 阅读 · 2 评论 -
感知器和适应机(Perceptron & Adaline)
文章目录共同点区别点代码演示感知器适应机共同点感知器和适应机都是用于线性二元分类问题的模型感知器和适应机都需要使用阈值函数,确定分类标准图中θ\thetaθ为阈值都是逐步学习,优化参数区别点适应机使用激活函数对输入数据多进行了一次处理,再使用激活函数产生的误差值进行参数优化,感知器则是直接利用分类结果进行参数优化适应机通过使用误差能够对输入数据进行连续优化,并且通过激活函数...原创 2020-03-25 11:45:10 · 1130 阅读 · 0 评论