数据挖掘
lyc2016012170
这个作者很懒,什么都没留下…
展开
-
python之K-邻近算法/kNN(附上注解代码)
简介又叫K-邻近算法,是监督学习中的一种分类算法。目的是根据已知类别的样本点集求出待分类的数据点类别。基本思想kNN的思想很简单:在训练集中选取离输入的数据点最近的k个邻居,根据这个k个邻居中出现次数最多的类别(最大表决规则),作为该数据点的类别。kNN算法中,所选择的邻居都是已经正确分类的对象。算法复杂度kNN是一种lazy-learning算法,分类器不需要使用训练集进行训练,因此训练时间复杂度为0;kNN分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中文档总.原创 2020-09-21 19:33:37 · 550 阅读 · 0 评论 -
30个学习大数据挖掘的重要知识点!建议收藏
下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下。1. 数据、信息和知识是广义数据表现的不同形式。2. 主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识3. web挖掘研究的主要流派有:Web结构挖掘、Web使用挖掘、Web内容挖掘4. 一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理,数据挖掘以及模式评估等基本阶段。5. 数据库中的知识发现处理过程模型有:阶梯处理过程模型,螺旋处理过程模型...原创 2020-09-17 10:12:33 · 762 阅读 · 0 评论 -
网站数据挖掘--从零开始建立数据分析师个人成长体系
对于任何一个企业,经验丰富、技巧娴熟的分析师都是企业的优秀资产。但一切都不是天生的,良好的个人规划是保障数据分析师迅速成长的关键。数据理解1、数据采集1、了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。很大程度上可以避免"垃圾数据进导致垃圾数据出"的问题。例子:当用户在离线状态下使用APP时,数据因无法联网而不能发出,导致正常时间...原创 2020-09-17 10:11:08 · 358 阅读 · 0 评论