机器学习
文章平均质量分 86
AntioniaMao
这个作者很懒,什么都没留下…
展开
-
【读书笔记】机器学习实战p19-2.1.2(k-近邻算法)
from numpy import *import operatordef createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return group,labelsdef classify0(inX,dataSet,labels...原创 2018-03-08 22:29:23 · 263 阅读 · 0 评论 -
【机器学习】数据挖掘算法-决策树-------机器学习~了解一下!
数据挖掘算法-决策树 目标:通过选择最佳的特征对数据集进行划分,以此将无序的数据变得有序,获得最佳的分类数据集:前n-1列为特征,第n列为类别标签算法流程:计算原始数据集信息熵->【香农熵】集合信息的度量方式(本文后续给出了详细计算方法)遍历使用每个特征对数据集进行划分(ID3算法)->【划分原则】将无序的数据变得更加有序找到最佳的划分特征->递归CreateTree->...原创 2018-03-10 11:18:34 · 339 阅读 · 0 评论 -
【信息系统】原理模块-Apriori频繁项集及关联特征算法
频繁项集及关联特征算法 实际场景:使用搜索引擎或者机器客服等信息查询系统时,当请求查询者输入一部分查询内容时,系统即可按照可能性大小,列举出用户可能想要查询的内容选项。 原理:通过搜集大量的历史查询记录,分析数据中的频繁项集及关联特征,以及自动推荐用户可能期望的查询内容名词解释: 频繁项集(frequent item sets)是指经常出现在一起的物品或信息的集合 关联...原创 2018-03-19 19:47:15 · 1021 阅读 · 0 评论