自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (11)
  • 收藏
  • 关注

原创 用户画像实战:基于Kmeas的电商潜在客户识别

电商潜在客户识别前言1、潜在客户识别概述如今,识别潜在客户是非常关键的,这样才能有更多的数据驱动策略来目标客户。因此,在客户智能领域,客户细分是一个核心应用程序,其中人们根据不同的属性(可能是购买习惯或行为习惯)进行聚类。它是无监督学习的一个应用,机器学习模型试图将相似的数据点聚集在一起,使得簇内距离最小,簇间距离最大。在这里,我使用的数据集包含了人们在商场的购买属性。数据集很简单,有5个特征,即客户ID、年龄、性别、信用评分和收入。2、分析目标在精准营销中,我们不仅要聚焦核心用户的需求,为我

2021-01-16 19:24:29 3067 1

原创 04 决策树

决策树特征选择1、策略:选择信息增益/信息增益比最大的特征2、熵与信息增益(1)熵熵表示的是随机变量不确定性的度量P(X=xi)=pi,i=1,2,…,nP(X= x_i) = p_i,i = 1,2,\dots,nP(X=xi​)=pi​,i=1,2,…,n,为取有限个值的离散随机变量X的概率分布,随机变量X的熵:H(X)=−∑i=1npilog⁡piH(X) = - \sum_{i=1}^n p_i \log p_iH(X)=−i=1∑n​pi​logpi​熵越大,随机变量的不

2021-01-14 20:25:59 149 1

原创 02 K近邻方法

K近邻方法模型不具有显式的学习过程,表现为k近邻法的模型对特征空间进行划分形成一个又一个的单元,单元中的实例的类标记是确定的。1、距离的度量闵氏距离Lp(xi,xj)=(∑l=1n∣xi(l)−xj(l)∣P)1P L_p(x_i,x_j) = (\sum_{l=1}^n |x_i^{(l)} - x_j^{(l)}|^{P})^{\frac{1}{P}} Lp​(xi​,xj​)=(l=1∑n​∣xi(l)​−xj(l)​∣P)P1​p =1 ,曼哈顿距离:L1(xi,xj)=

2021-01-14 20:04:59 139

原创 01 感知机方法

感知机方法模型f(x)=sign(w⋅x+b)f(x) = sign(w·x +b)f(x)=sign(w⋅x+b)策略损失函数极小化min⁡w,bL(w,b)=−∑xi∈Myi(w⋅xi+b)\begin{aligned}&\min_{w,b} L(w,b) = -\sum_{x_i \in M} y_i(w·x_i +b)\end{aligned}​w,bmin​L(w,b)=−xi​∈M∑​yi​(w⋅xi​+b)​损失函数:将损失函数定义为分类点到超平面S的距离总和

2021-01-14 20:02:39 93

原创 03 朴素贝叶斯方法

一、概述1、基本原理朴素贝叶斯法(navie Bayes)法式基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯法是一种基于属性集和类变量的概率关系建模方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入和输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率,将最大后验概率的类作为x的类别,由此求得输出y。本文介绍朴素贝叶斯分类器的由来。首先介绍贝叶斯定理,它是一种把类的先验知识与从数据中收集的新证据相结合的统计原理;然后解释贝叶斯定理在分类问题中的应用,接下来介

2021-01-10 22:41:29 256

java知识地图(思维导图).pdf

本资源是Java知识地图,包括Java基础、数据类型及操作、面向对象编程基础、异常处理、继承、封装、多态、数据结构、泛型和内部类、多线程、JDBC等内容,是一张能带你真正全面入门的知识地图。本附件为pdf格式,可以在浏览器打开。同时提供svg和png格式,请前往其他资源链接下载。

2020-11-27

Java知识地图(思维导图)

本资源是Java知识地图,包括Java基础、数据类型及操作、面向对象编程基础、异常处理、继承、封装、多态、数据结构、泛型和内部类、多线程、JDBC等内容,是一张能带你真正全面入门的知识地图。本附件为svg格式,可以在浏览器打开。同时提供pdf和png格式,请前往其他资源链接下载。

2020-11-27

数据挖掘、机器学习在客户细分中应用

基于真实电子商务客户交易数据进行数据挖掘,机器学习建模。用于预测客户类别。本项目数据来源于kaggle,项目报告提供了完整的数据分析流程和思路。

2018-06-29

《数据挖掘导论》 --附录内容

介绍学习数据挖掘前需要掌握的基础知识,包括概率论,线性代数,维规约,PCA,SVD等理论和技术

2018-05-23

《数据挖掘导论》--7 异常检测

异常处理部分介绍了数据挖掘前异常数据的类型及处理方法,及一些算法异常,包括过拟合等问题的处理。

2018-05-23

《数据挖掘导论》--聚类分析

《数据挖掘导论》第六部分内容,系统的涵盖了聚类分析的若干算法,并将算法原理,步骤及优缺点进行详细列出。可以站在聚类的系统和原理的层面详细的了解聚类的每种算法。

2018-05-23

《数据挖掘导论》--5 关联分析

《数据挖掘导论》中第五块内容,涵盖了关联分析算法的基础知识,基础应用和高级概念的内容。

2018-05-23

《数据挖掘导论》--分类

是《数据挖掘导论》中比较重要的一块内容。包含了分类算法的KNN,k-最邻近,决策树等重要分类算法。本导图涵盖了每个分类算法框架,原理和的重要知识点。有助于系统而全面的了解分类算法

2018-05-23

《数据挖掘导论》--3 数据探索

《数据挖掘导论》基础知识的最后一部分内容。在掌握数据的属性和特征后对数据进行综合的运用和应用解读

2018-05-23

《数据挖掘导论》--2 数据

是读懂数据挖掘导论的基础,重点章节。知识点较多,帮助我们剖析数据集的特征,从根本上了解数据及其属性,是数据清清洗和挖掘的重要铺垫。

2018-05-23

《数据挖掘导论》思维导图--1数据挖掘内涵、用途、目标、

《数据挖掘导论》读书后的思维导图 第一部分为数据挖掘的基础知识,帮我们明白数据挖掘是什么,可以用来做什么

2018-05-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除