![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习笔记
文章平均质量分 78
翱翔的江鸟
转行萌新学习中
github地址:https://github.com/wxfghy
展开
-
《机器学习实战》笔记01~学习算法前的准备
1.机器学习算法的用途 监督学习 算法 用途 K-临近算法 线性回归 朴素贝叶斯算法 局部加权线性回归 支持向量机 Ridge回归 决策树 Lasso最小回归系数估计 - 无监督学习 算法 用途 K-均值 最大期望算法 DBSCAN Parzen窗设计 2.选择算法的依...原创 2018-05-10 13:58:58 · 164 阅读 · 0 评论 -
《机器学习实战》笔记02~K-近邻(KNN)算法(分类)
1.K-近邻算法的优缺点 采用测量特征值间的距离的方法进行分类 优点在于,精度高,无数据输入假定,对异常值不敏感 缺点在于,计算复杂度和空间复杂度高 适用于数值型,标称型 2.KNN工作原理 存在训练样本集,样本集中每个数据都有标签及所属分类 新数据输入时,选择样本数据集中前k个(通常k不大于20)距离最近(最相似)的数据 统计k个数据中的分类数量,选择次数最多的分类分配给新数据 ...原创 2018-05-10 17:20:00 · 318 阅读 · 0 评论 -
算法基本名词解释
欧氏距离 适用环境: 用于描述两个多维点之间的距离 曼哈顿距离 适用环境: 用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差 高斯分布(正态分布) 参数说明: 1. exp是e^的意思,即e的指数,e约等于2.72 2. 极值为x=μ时,y=1/(√(2π)σ) 3. μ越大,函数曲线中轴越偏右 4. σ越大,函数曲线坡度越平...原创 2018-05-10 17:30:13 · 5143 阅读 · 0 评论 -
《机器学习实战》笔记03~决策树算法
1.决策树的优缺点 优点: 计算复杂度不高,结果易理解,对中间值缺失不敏感,可处理不相关的特征数据 缺点: 过度匹配 适用: 数值型,标称型原创 2018-05-21 16:20:54 · 258 阅读 · 0 评论