机器学习实战
JYNjyn666
这个作者很懒,什么都没留下…
展开
-
【机器学习实战学习笔记】Logistic 回归
Logistic 回归概要一般过程基于Logistic回归和Sigmoid函数的分类基于最优化方法的最佳回归系数确定梯度上升法训练算法 概要 本章共分为四个部分: (1)Sigmoid函数和Logistic回归分类器 (2)最优化理论初步 (3)梯度下降最优化算法 (4)数据中的缺失项处理 回归 假设有一些数据点,用一条直线对这些点进行拟合,这条线称为最佳拟合直线,这个拟合过程称为回归 主要思想 根据现有数据对分类边界线建立回归公式,以此来进行分类 一般过程 Logistic回归的一般过程: (1)收集原创 2020-11-25 13:56:33 · 113 阅读 · 0 评论 -
【机器学习实战学习笔记】基于概率论的分类方法——朴素贝叶斯
朴素贝叶斯基本思想特点一般过程示例1 基本思想 朴素贝叶斯的基本思想就是选择高概率对应的类别,即如果有两类, 若p1(x,y)>p2(x,y),则分类类别为1 若p1(x,y)<p2(x,y),则分类类别为2 特点 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式比较敏感 适用数据类型:标称型数据 一般过程 (1)收集数据:可以使用任何方法,这里使用RSS源 (2)准备数据:需要数值型或者布尔型数据 (3)分析数据:有大量特征时,绘制特征作用不大,此时可以使用直原创 2020-10-07 15:54:42 · 139 阅读 · 0 评论 -
【机器学习实战学习笔记】决策树
决策树特点算法伪代码一般流程示例1 特点 –优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 –缺点:可能会产生过度匹配的问题 –使用数据类型:数值型和标准型 决策树首要解决的问题就是:如何选取具有决定性作用的数据特征 算法伪代码 def createBranch(): If so return 类标签 Else 寻找划分数据集的最好特征 划分数据集 创建分支节点 for 每个划分的子集 调用函数createBranch()并增加返回结果到分原创 2020-09-29 10:51:15 · 113 阅读 · 0 评论 -
【机器学习实战学习笔记】k-近邻算法
【机器学习实战——k-近邻算法】工作原理特点一般流程使用算法过程示例1示例2一般流程 工作原理 存在一个样本数据集合,并且样本集合中每个数据都存在标签,即知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签 **一般k不大于20 特点 –优点:(1)精度高 (2)对异常值不敏感 (3)无数据输入假定 –缺点:计算复杂度高、空间复杂度高 –适用数据范围:数值型和标称型 注: 标称型数据:一般在有限的数据原创 2020-09-23 19:07:48 · 153 阅读 · 0 评论