机器学习
文章平均质量分 90
Ashlyn_z
这个作者很懒,什么都没留下…
展开
-
机器学习实战之 -- kNN
机器学习实战之 -- kNNk-近邻算法一、工作原理二、代码实现1.创建样本数据集和标签2.利用kNN算法返回频率最高的元素标签三、示例1.准备数据:从文本中解析数据,输出训练样本矩阵和类标签向量。2.分析数据:使用Matplotlib绘制散点图3.归一化数值4.测试算法5.使用算法k-近邻算法Lp(xi,xj)=(∑l=1n∣xi(l)−xj(l)∣p)1/pL_p(x_i,x_j) = (...原创 2018-12-22 00:13:53 · 186 阅读 · 0 评论 -
机器学习实战 -- 决策树
机器学习实战 -- 决策树决策树一、决策树算法简介二、工作原理经验熵(empirical entropy)经验条件熵(empirical conditional entropy):信息增益(information gain):三、核心代码1.创建数据集2.计算数据集的经验熵3.划分数据集a. 按照指定的特征划分数据集b. 选择最好的特征划分数据集4.递归构建决策树5.绘制树形图a. 使用文本注解绘...原创 2018-12-23 01:09:58 · 197 阅读 · 0 评论 -
scikit-Learn demo
Scikit-Learn -- 实战一、大致流程1.Practice regressiona.LinearRegressionb.DecisionTree2.practice Classificationa.LogisticRegressionb.SVM二、Model selection1.Cross - Validation2.模型参数的选择三、underfit和overfit一、大致流程1...原创 2019-03-07 00:22:46 · 440 阅读 · 0 评论 -
模型评估与模型选择
模型评估与模型选择一、损失函数和风险函数1.经验风险和结构风险2.经验风险最小化与结构风险最小化二、模型评估与模型选择1.最小二乘法2.过拟合代码实现3.模型选择a.正则化一、损失函数和风险函数损失函数:一次预测的好坏风险函数:平均意义下模型预测的好坏0-1损失函数 (0-1 loss function)L(Y,f(X))={1,Y≠f(X)0,Y=f(X)L(Y,f(X))=\be...原创 2019-03-10 05:55:27 · 530 阅读 · 0 评论 -
机器学习实战之 -- NaiveBayes
机器学习实战之 -- NaiveBayesNaiveBayes一、工作原理1.条件概率:2.朴素贝叶斯成立的条件概率假设:3.后验概率:3.朴素贝叶斯分类器:二、核心代码NaiveBayes一、工作原理1.条件概率:P(X=x∣Y=ck)=P(X(1)=x(1),...,X(n)=x(n)∣Y=ck), k=1,2,3,...,K P(X=x|Y=c_...原创 2019-03-29 15:47:05 · 311 阅读 · 0 评论 -
集成学习实战之 -- AdaBoost
机器学习实战之 -- AdaBoostAdaBoost一、AdaBoost简介二、工作原理1.错误率:2.弱分类器权重值:3.权重更新:4.最终分类器a.弱分类器的线性组合b.最终分类器三、核心代码1.基于单层决策树构建弱分类器3.基于单层决策树的AdaBoost训练4.测试算法:基于 AdaBoost的分类四、示例AdaBoost一、AdaBoost简介AdaBoost采用的是boosti...原创 2019-03-29 01:53:05 · 238 阅读 · 0 评论 -
集成学习实战之 -- RandomForest
集成学习实战之 -- RandomForest一、引入1.Linear modela.用线性模型拟合非线性数据:1)拟合较平滑的曲线2)拟合不规则曲线2.引入决策树a.两个问题1)决策树是线性模型吗?2)决策树能解决上面的问题吗?b.决策树的特点c.拟合数据二、模型融合1.Bagging2.Random Foresta.手动构建a.用sklearn中的模型构建一、引入1.Linear mode...原创 2019-03-29 10:51:40 · 528 阅读 · 0 评论