自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Local Outlier Factor 算法(以Boxplot探测LOF离群值)及python手写(非sklearn)

local outliers “本地离群值”,能够在基于密度不同的数据分布下,探测出各个不同密度集群边缘的离群值。LOF是基于密度的离群值探测算法,通过计算样本的local outlier factor(翻译过来应该是本地离群值因子)以判断该样本是否为离群值。LOF四部曲k-distance设定一个整数 k 和一个点 o ,点 o 的k-distance为 k-distance(o) = ɛNk(o) 为点o的 ɛ-近邻的个数,Nk(o)为整数,通常Nk(o)就等于kɛ 是点 o 与第 k 个

2020-08-01 00:01:36 1091

原创 协同过滤 改进:加权平均CF-GBRT —— 偏好与共性结合

1 协同过滤Collaborative Filtering(CF)1.1 协同过滤算法解释:https://blog.csdn.net/wangdong2017/article/details/87872351?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-71.2 一张图看懂协同过滤假设现在需要对用户会喜欢什么电影进行预测,在上图(用户x电影)矩阵中,黄格子是用户看过的电影且里面的数字是他们对电影的评分,协同过滤算法的任务是预测

2020-06-11 15:31:15 1119

原创 Python NetworkX +Gephi利用PageRank和K-Clique分析并可视化社会网络

先导入即将用到的包import matplotlib.pyplot as pltimport osimport networkx as nximport pandas as pdimport numpy as np

2019-12-17 22:32:07 2423 2

原创 (Python爬虫/自然语言处理)BeautifulSoup+webdriver爬电视剧文本数据并统计Tfidf以进行相似度处理和文本聚类

近来很闲,在优酷爬个2019年内地剧的简介,然后给宝贝女友做个简陋的电视剧推荐。在python准备好需要用到的包,大概是import reimport timeimport requestsfrom bs4 import BeautifulSoupimport numpy as npfrom selenium import webdriverfrom selenium.webdri...

2019-12-17 14:56:23 1098

原创 通过Python做葡萄酒成分与质量的关系分析并可视化--GBDT/随机森林特征选取

葡萄酒成分与质量关系分析 -- 通过GBDT以及Random Forests进行特征选取在UCI下载葡萄酒数据集,链接:https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/ 红酒有1599个样本,白葡萄酒有4898个样本,本文使用红酒的数据集,文件名为winequality-red.csv数据预处理先...

2019-12-15 15:44:35 5450 4

原创 Density Peaks密度峰值聚类算法自动化--平均近邻百分比取密度范围以及outliers探测取聚类中心个数

文章先简单介绍密度峰值聚类算法过程,在聚类过程中详细介绍如何使用平均近邻百分比取密度探测范围,以及后面进行对应的离群值探测。拿一个二维数据举例(上图),对于每一个点,我们计算其到所有其它点的欧几里得距离,取一个密度范围(半径)k,再计算所有点在 k 范围内的密度,即以该点为圆心计算在半径k内有n个其它点的存在,那么n就是其密度。(在这一步上,滕建,乐红兵提出差序密度贡献方法,为减小算法时间复杂...

2019-11-17 18:07:38 1251 2

原创 VBA自定义函数-Minkowski距离

接触VBA第一天,写了个闵可夫斯基距离当r=1时,距离为曼哈顿距离当r=2时,距离为欧几里得距离距离(直线距离)当r→∞时,距离为切比雪夫距离根据闵可夫斯基距离距离公式,在VBA写出以下代码Public Function distance(a As Range, b As Range, Optional r As Integer = 2) Dim i As Integer ...

2019-11-17 14:05:30 581

原创 AutoEncoder的简介与使用pytorch建立(Stacked) AutoEncoder推荐系统

AEBoltzmann Machine的Visible nodes直观来说是input,但实际上visible nodes与hidden nodes是在同一个系统下不分你我。在Restricted Boltzmann Machine (RBM)下有更直观清晰的对visible nodes与hidden nodes,AE这里的visible nodes 与hidden nodes与RBM的类似,...

2019-06-18 20:09:58 2567

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除