Machine Learning
文章平均质量分 73
Juanly Jack
此人很懒。
展开
-
数据挖掘--基于KMeans算法的客户价值分析
数据下载链接:链接:https://pan.baidu.com/s/1EFiYAceEkZsnBkVNjTlH_A提取码:v1641、客户价值分析:客户价值分析就是一个客户分群问题,以客户为中心,从客户需求出发,搞清楚客户需要什么,他们有怎样的一个特征,需要什么样的产品,然后设计相应的产品满足客户的需求。进行客户价值分析,可以避免商家闭门造车以及主管臆断客户的需求。项目背景为某电信运营商...原创 2018-10-17 19:58:10 · 3908 阅读 · 1 评论 -
EM算法推导笔记
字迹潦草,莫见怪,仅为方便本人记忆。*********![](https://img-blog.csdn.net/20181015003900969?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzM4MDg4MzU5/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)...原创 2018-10-15 00:40:35 · 291 阅读 · 0 评论 -
无监督学习-聚类系列之常见模型
聚类是一个大的家族,常见的分类有6种,而各种聚类又有许多变型,这里总结下自己学习的常见聚类及其原理。1、划分聚类:k—means算法步骤:(1)提前假设k个簇,对于实际问题会有一些启发式的选取方法,大多数是随机选取。但由于初值会影响结果所以往往多次选择初值并去结果最好的那一次。(2)将每个数据点归类到离它最近的哪个中心点所带表的簇。这里注意距离的度量也即相似度,一般高维稠密用欧氏距离,但如...原创 2018-10-14 13:18:00 · 1920 阅读 · 0 评论 -
LogisticRegression 梯度上升及决策边界代码实现
LogisticRegression梯度上升及决策边界代码实现 时间原因,暂时先敲这两部分,模型准确率后期完善。import numpy as npdef loadDataSet(): dataMat = [] #创建数据列表 labelMat = [] ...原创 2018-08-25 15:55:08 · 468 阅读 · 0 评论 -
LDA主题模型浅析 -- 笔记
0、前言LDA是两个常用模型的简称:Linear Discriminant Analiysis 和Latent Dirichlet Allocation.LDA(Latent Dirichlet Allocation)在文本建模中类似于SVD,PLSA等模型,可以用于浅层语义分析,在文本语义分析中是一个很有用的模型.这个模型涉及到Gamma函数,Dirichlet分布(狄利克雷分布),Dir...原创 2018-10-22 23:33:43 · 3663 阅读 · 1 评论