数据挖掘
记录学习数据挖掘的点滴
Polaris_T
失败总是贯穿人生的始终,这就是常态。
展开
-
西电数据挖掘实验3——复杂网络社团检测
复杂网络是描述复杂系统的有力工具,其中每个实体定义成一个节点,实体间的交互关系定义为边。复杂网络社团结构定义为内紧外松的拓扑结构,即一组节点的集合,集合内的节点交互紧密,与外界节点交互松散。复杂网络社团结构检测广泛的应用于信息推荐系统、致癌基因识别、数据挖掘等领域。 本实验利用两类数据:模拟数据与真实数据。模拟数据有著名复杂网络学者Mark Newmann所提出,该网络包括128个节点,每个节点的度为16,网络包含4个社团结构,每个社团包含32个节点,每个节点与社团内部节点有k1k_1k1个节点相互原创 2022-06-27 11:43:04 · 3241 阅读 · 7 评论 -
西电数据挖掘实验1——二分网络上的链路预测
基于网络结构的链路预测算法被广泛的应用于信息推荐系统中。算法不考虑用户和产品的内容特征,把它们看成抽象的节点,利用用户对产品的选择关系构建二部图。为用户评估它从未关注过的产品,预测用户潜在的消费倾向。...原创 2022-06-27 11:28:28 · 2408 阅读 · 0 评论 -
西电计科数据挖掘期末复习笔记
本人西电19计科,数据挖掘期末95+,这是复习期间整理的笔记,基本涵盖了课程全部重点,有需要的学弟学妹可以在复习的时候参考一下。原创 2022-03-26 09:59:09 · 6643 阅读 · 2 评论 -
CART决策树算法的Python实现(注释详细)
一、CART决策树算法简介CART(Classification And Regression Trees 分类回归树)算法是一种树构建算法,既可以用于分类任务,又可以用于回归。相比于 ID3 和 C4.5 只能用于离散型数据且只能用于分类任务,CART 算法的适用面要广得多,既可用于离散型数据,又可以处理连续型数据,并且分类和回归任务都能处理。本文仅讨论基本的CART分类决策树构建,不讨论回归树和剪枝等问题。首先,我们要明确以下几点:1. CART算法是二分类常用的方法,由CART算法生成的决策树原创 2021-10-27 16:36:44 · 16456 阅读 · 10 评论 -
ID3、C4.5决策树算法的Python实现(注释详细)
一、决策树之ID3和C4.5简介决策树(Decision Tree),每个分支都是需要通过条件判断进行划分的树,解决分类和回归问题的方法。决策树是最经常使用的数据挖掘算法,其核心是一个贪心算法,它采用自顶向下的递归方法构建决策树。目前常用的决策树算法有ID3算法、改进的C4.5,C5.0算法和CART算法ID3算法的核心是在决策树各级节点上选择属性时,用信息增益作为属性的选择标准,使得在每一个非节点进行测试时,能获得关于被测试记录最大的类别信息。C4.5在选取最优特征时,采用的衡量标准是信息增益率。原创 2021-10-25 20:22:19 · 11707 阅读 · 4 评论 -
详解马氏距离中的协方差矩阵计算(超详细)
一、概率统计基本知识1.样本均值样本均值(Mean)是在总体中的样本数据的平均值。2.样本方差方差(Variance)是度量一组数据的离散(波动)程度。方差是各个样本与样本均值的差的平方和的均值,分母除以n-1是为了满足无偏估计:3.样本标准差4.协方差协方差(Covariance)是度量两个变量的变动的同步程度,也就是度量两个变量线性相关性程度。若协方差大于0,表示一个变量增大时另一个变量也会增大,即两个变量呈正相关;若协方差小于0,表示一个变量增大时另一个变量会减小,即两个变量呈负相关原创 2021-10-08 16:43:46 · 17583 阅读 · 8 评论 -
B站清华数据挖掘笔记(六)——集成学习(Bagging&AdaBoost)
原创 2021-08-25 22:04:25 · 287 阅读 · 0 评论 -
B站清华数据挖掘笔记(五)——Apriori算法
原创 2021-08-25 22:00:31 · 307 阅读 · 0 评论 -
B站清华数据挖掘笔记(四)——聚类(K-Means&层次聚类)
原创 2021-08-25 21:57:51 · 351 阅读 · 0 评论 -
B站清华数据挖掘笔记(三)——3类SVM支持向量机决策超平面的推导
原创 2021-08-25 21:55:30 · 374 阅读 · 0 评论 -
B站清华数据挖掘笔记(二)——感知机&手推BP神经网络权重更新公式
原创 2021-08-25 21:50:07 · 1474 阅读 · 1 评论 -
B站清华数据挖掘笔记(一)——朴素贝叶斯&决策树
原创 2021-08-25 21:44:29 · 598 阅读 · 0 评论