机器学习实战
文章平均质量分 62
Polestar-400
中国科学院计算机软件与理论专业博士生在读
本科计算数学专业
展开
-
《机器学习实战》第五章学习笔记(已更完)
《机器学习实战》第五章学习笔记原创 2022-04-17 22:28:44 · 1128 阅读 · 13 评论 -
《机器学习实战》第四章学习笔记(已更完)
本章介绍的是朴素贝叶斯的分类方法,条件概率和贝叶斯决策理论这里不做叙述,需要注意的是朴素贝叶斯的前提:即样本的所有特征之间相互独立,这样可以大大减少模型所需的样本数量(意味着所有的特征计算都可以用同一批样本)。本章主要利用贝叶斯进行文本分类,所以首先涉及到的是文本表示,即怎样把语言信息表示为计算机可以处理的数字信息。书中给的例子是文本分类,判断网页留言是侮辱性还是非侮辱性的。首先是文本的构建过程,下面给了一组带有分类标签的文本数据def loadDataset():#创建了一些实验样.原创 2022-04-07 16:32:39 · 1507 阅读 · 2 评论 -
《机器学习实战》第三章学习笔记(更新中)
第三章主要讲述的内容是决策树的源码和利用Matplotlib绘制树形图决策树的核心是利用递归一级一级进行分类:def createBranch()If so return 类标签;Else 寻找划分数据集的最好特征(香农熵) 划分数据集 创建分支节点 for 每个划分的子集: 调用函数createBranch()并增加返回结果到分支节点中 return 分支节点分类的依据是香农熵的计算,其表示的是信息增益的大小,代码及注释如下def calcShannon原创 2022-03-24 22:30:56 · 1906 阅读 · 2 评论