![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
lili安
立志成为大牛的一只小菜鸟
展开
-
图挖掘算法-gSpan
原文链接:https://blog.csdn.net/qq_41653753/article/details/79112436原文链接:https://blog.csdn.net/weidai00/article/details/85245217一、基本概念1、图挖掘近年来,图挖掘作为,数据挖掘的重要组成部分引起了社会各界的极大关注。图挖掘(Graph Mining)是指利用图模型从海量数据中发现和提起有用知识和信息的过程。通过图挖掘所获取的知识和信息已广泛应用于各种领域,如商务管理、市场分转载 2020-05-12 10:00:41 · 5255 阅读 · 4 评论 -
关联规则之序列模式挖掘
一、序列购物篮数据常包含关于商品何时被顾客购买的信息。可以使用这些信息,将顾客在一段时间内的购物拼接成事务序列,这些事务通常基于时间或空间的先后次序。一般地,序列是元素的有序列表。可以记做;其中每个是多个事件的集簇,即1. web站点访问者访问的web页面序列:<{主页} {电子产品} {照相机和摄像机} {数码相机} {购物车} {订购确认} {返回购物}>2. ...原创 2020-03-30 14:14:59 · 1253 阅读 · 0 评论 -
(一)数据挖掘---挖掘频繁模式、关联和相关性
一、频繁模式频繁地出现在数据集中的模式(如项集、子序列或子结构)。例1:频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合是频繁项集。 2:购物篮分析案例:通过发行顾客放入它们购物篮中商品之间的关联,分析顾客购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁地被顾客同时购买,从而帮助它们制定更好的营销策略。二、支持度、置信度关联规则的支持度(support)和...原创 2020-03-24 19:27:04 · 2036 阅读 · 0 评论 -
分类算法之支持向量机(SVM)
一、概念支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器,如果进行修改之后也是可以用于多类别问题的分类。支持向量机可以分为线性和非线性两大类。其主要思想为找到空间中的一个更够将所有数据样本划开的超平面,并且使得样本集中所有数据到这个超平面的距离最短。其决策边界是对学习样本求解的最大边距超平面。决策边界:在具有两个类的统计分类问题中,决策边界或决策表面是超曲面,其将基础向量空...原创 2019-12-30 17:04:15 · 1625 阅读 · 0 评论 -
(二) 数据挖掘之分类
一、分类的主要思想分类是一种重要的数据分析形势,它提取刻画重要数据类的模型。这种模型称为分类器,预测分类(离散的、无序的)类标号。例如:可以建立一个分类模型,把银行贷款申请划分成“安全”或"危险";销售数据的“是”或“否”;等等。这些类别可以用离散值表示,其中值之间的次序没有意义。数据分析任务都是分类,都需要构造一个模型或分类器来预测类标号。销售经理希望预测给定的顾客将花多少钱...原创 2019-12-30 16:27:18 · 2373 阅读 · 0 评论