![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
逐步学习数据挖掘
翊小宸
决定你人生的不仅仅是能力,还有你的格局。
展开
-
数据挖掘——KNN算法预测测试数据的物种分类
iris.arff数据集包含了150条关于花的数据,这些数据被等分为3类Iris物种:Setosa、Versicolor和Virginica,每朵花的数据描述有四项特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。问题:简述K近邻分类算法的思想和优缺点,并通过KNN算法预测测试数据的物种分类,请写出详细的算法过程。import numpy as npimport operator as optimport matplotlib.pyplot as pltimport coll...原创 2020-06-17 20:48:14 · 1842 阅读 · 0 评论 -
数据挖掘学习笔记(六)
数据的相似性和相异性相似性(Similarity) 两个对象相似程度的数量表示 数值越高表明相似性越大 通常取值范围为[0,1] 相异性(Dissimilarity)(例如距离) 两个对象不相似程度的数量表示 数值越低表明相似性越大 相异性的最小值通常为0 相异性的最大值(上限)是不同的 邻近性(Proximity):相似性和相异性都称为邻近性1.数据矩...原创 2020-02-24 21:22:44 · 5106 阅读 · 0 评论 -
数据挖掘学习笔记(五)
数据的基本统计描述-目的 更好的识别数据的性质,把握数据全貌。- 三个主要方面 中心趋势度量 数据分散度量 基本统计图1.中心趋势度量均值(代数方法)(样本vs总体) 记:n是样本个数 N是总体个数 例:有score学生考试成绩的值:60,45,33,77,80,100,100,90,70,65。 ...原创 2020-02-22 13:52:47 · 1014 阅读 · 0 评论 -
数据挖掘学习笔记(四)
第二章 数据数据预处理是数据挖掘过程的第一个主要步骤,了解数据才能为分析与挖掘做好预处理。数据的属性:数据值类型数据的分布图形表示形式数据的相似性与相异性数据的属性1.数据对象数据集由数据对象组成。一个数据对象代表一个实体。例如:销售数据库:顾客、商品、销售医疗数据库:患者、医生、诊断治疗大学生数据库:学生、教授、课程数据对象又称为样本、实例、数据...原创 2020-02-17 19:08:12 · 780 阅读 · 0 评论 -
数据挖掘学习笔记(三)
数据分析与数据挖掘的方法1.频繁模式频繁模式:数据中频繁出现的模式。频繁项集:频繁在事务数据集中一起出现的商品集合。例如,信用卡分析、患者就诊分析、购物车分析…2.分类与回归分类与标签预测是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标识未知的对象的类标号。分类预测类别(离散的、无序的)标号,回归建立连续值函数模型,也就是用来预测缺失的或难以获得的数值数据值。...原创 2020-02-17 15:59:43 · 1560 阅读 · 0 评论 -
数据挖掘学习笔记(二)
数据分析与挖掘的数据类型数据库数据数据仓库数据事务数据数据矩阵图和网状数据其他类型的数据1.数据库数据数据库系统(DataBase System,DBS)由一组内部相关的数据(称作数据库)和用于管理这些数据的程序组成,通过软件程序对数据进行高效的存储和管理。2.关系数据库基于关系数据库模型数据表的集合关系查询语句SQL(Structured Query Langu...原创 2020-02-14 18:57:07 · 321 阅读 · 0 评论 -
数据挖掘学习笔记(一)
概述数据分析与数据挖掘1.数据分析采用适当的统计分析方法对收集到的数据进行分析、概括和总结,对数据进行恰当的描述,提取有用的信息的过程。数据分析一般具有比较明确的目标,可以根据数据分析的结果得出适当的判断,用来为以后的决策提供依据。早在20世纪初期,数据分析的基础就已经确立。数据分析的结果有表格,图(排列图、因果图、散布图、直方图、控制图)等表示方法。2.数据挖掘(Data Mi...原创 2020-02-14 10:51:42 · 664 阅读 · 0 评论