机器学习笔记
文章平均质量分 78
翱翔的江鸟
转行萌新学习中
github地址:https://github.com/wxfghy
展开
-
《机器学习实战》笔记01~学习算法前的准备
1.机器学习算法的用途监督学习 算法 用途 K-临近算法 线性回归 朴素贝叶斯算法 局部加权线性回归 支持向量机 Ridge回归 决策树 Lasso最小回归系数估计- 无监督学习 算法 用途 K-均值 最大期望算法 DBSCAN Parzen窗设计2.选择算法的依...原创 2018-05-10 13:58:58 · 168 阅读 · 0 评论 -
《机器学习实战》笔记02~K-近邻(KNN)算法(分类)
1.K-近邻算法的优缺点采用测量特征值间的距离的方法进行分类优点在于,精度高,无数据输入假定,对异常值不敏感缺点在于,计算复杂度和空间复杂度高适用于数值型,标称型2.KNN工作原理存在训练样本集,样本集中每个数据都有标签及所属分类新数据输入时,选择样本数据集中前k个(通常k不大于20)距离最近(最相似)的数据统计k个数据中的分类数量,选择次数最多的分类分配给新数据...原创 2018-05-10 17:20:00 · 328 阅读 · 0 评论 -
算法基本名词解释
欧氏距离 适用环境: 用于描述两个多维点之间的距离曼哈顿距离 适用环境: 用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差高斯分布(正态分布) 参数说明: 1. exp是e^的意思,即e的指数,e约等于2.72 2. 极值为x=μ时,y=1/(√(2π)σ) 3. μ越大,函数曲线中轴越偏右 4. σ越大,函数曲线坡度越平...原创 2018-05-10 17:30:13 · 5164 阅读 · 0 评论 -
《机器学习实战》笔记03~决策树算法
1.决策树的优缺点优点: 计算复杂度不高,结果易理解,对中间值缺失不敏感,可处理不相关的特征数据缺点: 过度匹配适用: 数值型,标称型原创 2018-05-21 16:20:54 · 271 阅读 · 0 评论