![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 85
Night__owl
|人总是踌躇不前,被路上的风景阻挡了通往彼岸的桥|
展开
-
数据挖掘(Data Mining):数据,图和文本
图中节点特征首先对于图中节点来说,我们以每个点所连接的边的个数定义它的degree(度), p(degree=k) = Nk/N 表示随机选取一个点,degree为k的概率。 n0 n1 n2 n3 n4 n5 n6 n7 n8 degree 4 2 3 1 2 2 1 2 1 随机图(Random Graphs)随机图是图家族中的一个概率分布,通常用G(n,p)表示,n表示...原创 2021-10-31 16:17:40 · 369 阅读 · 0 评论 -
数据挖掘(Data Mining):异常检测(Anomally Detection)
Anomaly detectionDefinition异常意味着一个观测点不满足一个正常的距离数据集的分布,即不满足分布的大多数实例。异常,特征和原因 (Anomalies: features and causes) An outlier of the data, which is obviously far away from the majority of instances. Be measured by carefulness measurer. Error w原创 2021-10-04 21:12:59 · 1128 阅读 · 0 评论 -
数据挖掘(Data Mining):基础导论
本文主要讲诉数据挖掘的基本概念,现存的挑战和五大任务。原创 2021-09-29 21:53:38 · 1328 阅读 · 0 评论 -
Data Mining:图聚类(Graph clustering)
Betweenness Centrality (from wikipedia)在图论中,介数中心性(英語:Betweenness Centrality)是基于最短路径针对网络图中心性的衡量标准之一。针对全连接网络图,其中任意两个节点均至少存在一个最短路径,在无权重网络图中该最短路径是路径包含边的数量求和,加权网络图中该最短路径则是路径包含边的权重求和。每个节点的介数中心性即为这些最短路径穿过该节点的次数。Girvan-Newman algorithm (格里-纽曼算法)1. 首先计算网络中..原创 2021-09-18 05:15:27 · 4576 阅读 · 1 评论 -
数据挖掘(Data Mining):序列模式(Sequential Patterns)
序列模式购物篮数据常常包含关于商品何时被顾客购买的时间信息,利用这种信息可以将顾客在一段时间内购买的物品拼成事物序列。这种数据代表的时间之间存在某种序列关系,通常基于时间或空间的先后次序。然而,迄今为止所讨论的关联模式概念都只强调同时出现,而忽略数据中的序列信息。但是序列信息对于识别动态系统的重要特征,或者预测特定事件的未来发生时非常有价值的。问题描述发现序列模式(Mining Sequential Patterns)的问题输入是一个序列数据集,每一行记录与一个特定的对象(Object)所关联的原创 2021-09-17 02:59:49 · 4862 阅读 · 0 评论