机器学习实战
文章平均质量分 60
RounrounZhang
这个作者很懒,什么都没留下…
展开
-
机器学习实战-kNN
读书笔记-机器学习实战-kNN kNN思想: 已知训练样本集和其对应的标签,对于没有标签的新数据,将新数据的每个特征和训练样本集中数据对应的特征进行比较,提取样本集中最相似的k个数据的标签,选择k个最相似数据中出现最多次数的标签作为新数据的标签。 1.从文本文件中解析数据 对未知类别属性的数据集中的每个点依次执行以下操作: (1)计算已知类别数据集中的点与当前点之间的距离原创 2018-01-23 13:14:52 · 220 阅读 · 0 评论 -
kNN-手写数字识别
kNN - 手写数字识别 识别手写的数字0-9,图像为32像素×\times32像素的黑白图像 1.将图像转换为向量 将32×\times32的二进制图像矩阵转换为1×\times1024的向量。 #将图像转化为向量 def imgVector(filename): returnVect = zeros((1,1024)) fr = open(filename)原创 2018-01-24 14:48:32 · 403 阅读 · 0 评论 -
决策树-机器学习实战
决策树 决策树模型是一种描述对实例进行分类的树形结构,决策树由节点和有向边组成,节点有两种类型:内部节点和叶节点。内部节点表示一个特征或属性,叶节点表示一个类。 通常决策树的学习包括3个步骤:特征选择、决策树的生成和决策树的修剪。 特征选择:选取对训练数据具有分类能力的特征 通常的准则是信息增益或者信息增益比 1. 信息增益 熵:表示随机变量不确定性的度量。原创 2018-01-25 16:50:03 · 263 阅读 · 0 评论 -
朴素贝叶斯分类
一、概念 朴素贝叶斯 朴素:条件独立性假设,指特征之间的相互独立性假设,即一个特征出现的可能性与其他特征没有关系。比如说,假设单词bacon出现在unhealthy后面和delisious后面的概率相同。 使用条件概率进行分类:选择具有最高概率的决策 贝叶斯准则: 二、使用朴素贝叶斯进行文档分类 准备数据:将句子转换成向量,统计所有文档中出现的单词形成列表 def lo...原创 2018-03-05 20:34:55 · 251 阅读 · 0 评论