自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

原创 机器学习 — python(sklearn / scipy) 实现层次聚类,precomputed自定义距离矩阵

文章目录python 实现层次聚类1. scipy实现2. sklearn实现python 实现层次聚类关于层次聚类的原理,可以参考博客:https://blog.csdn.net/pentiumCM/article/details/105675576本博客主要讲解如何简单直接使用 python 来实现层次聚类。1. scipy实现linkage:def linkage(y, me...

2020-04-22 23:35:22 17373 4

原创 机器学习 — 主成分分析(PCA),python(sklearn)实现

文章目录主成分分析一、概念二、内容参考资料主成分分析一、概念主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过 正交变换 将一组可能存在相关性的变量转换为 一组 线性不相关 的变量,转换后的这组变量叫 主成分。二、内容基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的 综合指标 来代替...

2020-04-19 00:12:25 3645 2

原创 小白玩转 scrapy 爬虫框架

文章目录scrpay爬虫框架一、初窥Scrapy二、Scrapy框架运行原理1. 组件解释2. 爬虫运行顺序:三、Scrapy 框架使用四、实例演示参考资料scrpay爬虫框架一、初窥ScrapyScrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了 页面抓取 (更确切来说, 网络抓取 )所设计的,...

2020-04-30 23:28:58 206

原创 机器学习—python 实现网格聚类算法,子空间聚类 CLIQUE算法(pyclustering)

文章目录python 实现网格聚类算法一、基于网格聚类原理二、算法实现1. CLIQUE 算法参考资料python 实现网格聚类算法一、基于网格聚类原理基本思想:基于网络的方法:这类方法的原理就是将数据空间划分为网格单元,将数据对象集映射到网格单元中,并计算每个单元的密度。根据预设的 密度阈值 判断每个网格单元是否为 高密度单元,由邻近的稠密单元组形成 “类”(簇)。算法过程:...

2020-04-29 11:16:09 10763 15

转载 matplotlib 支持中文显示

matplotlib 支持中文显示import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号...

2020-04-27 14:07:39 191

原创 python(sklearn) 聚类性能度量

python(sklearn) 聚类性能度量一、sklearn聚类评价函数:metrics.adjusted_mutual_info_score(…[, …]) metrics.adjusted_rand_score(labels_true, …) metrics.calinski_harabasz_score(X, labels) metrics.davies_bouldin_sco...

2020-04-25 23:07:47 2525 3

原创 python 三维绘图

文章目录python三维绘图一、创建三维坐标轴对象Axes3Dpython三维绘图一、创建三维坐标轴对象Axes3D有两种方式:目的都是生成具有三维格式的对象 Axes3D.方式一利用参数 projection=‘3d’ 来实现:#!/usr/bin/env python# encoding: utf-8'''@Author : pentiumCM@Email : ...

2020-04-24 16:23:54 654

原创 机器学习 - 聚类,聚类类别,聚类相似度,聚类性能度量

文章目录聚类一、概念二、聚类的类别1. 基于划分的聚类2. 基于层次的聚类3. 基于密度的聚类4. 基于网格的聚类5. 基于模型的聚类6. 基于模糊的聚类三、聚类的相似度度量参考资料聚类一、概念无监督学习:无监督学习(Unsupervised learning):训练样本的标记信息是未知的,目标是为了揭露训练样本的内在属性,结构和信息,为进一步的数据挖掘提供基础。监督学习:监...

2020-04-22 22:08:56 2708

原创 python — numpy计算矩阵特征值,特征向量

文章目录numpy计算矩阵特征值,特征向量一、示例:二、numpy实现:numpy计算矩阵特征值,特征向量一、示例:首先借参考百度demo的来看一下矩阵的特征值和特征向量的解题过程及结果。可知矩阵A:特征值为1对应的特征向量为 [ -1,-2,1]T。特征值为2对应的特征向量为 [ 0,0,1]T我们可以进一步对特征向量进行单位化,单位化之后的结果如下:特征值为1对应的特征向量为 [...

2020-04-21 11:10:01 53218 7

原创 算法思想 - 回溯算法,0/1背包,全排列等问题

文章目录回溯算法1、基本思想2、解题步骤回溯算法回溯算法(backtracking algorithm),也叫试探法,实际上一个类似枚举的搜索尝试过程,主要是在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就“回溯”返回,尝试别的路径。回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技...

2020-04-04 10:44:00 599

原创 算法思想 - 贪心算法

文章目录算法思想 - 贪心算法1. 基本思想2. 过程算法思想 - 贪心算法贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关1. 基本思想...

2020-04-02 11:21:12 708

飞零手机数据恢复助手

飞零手机数据恢复助手 可以将微信数据恢复成可视化的网页的工具,具体的操作步骤见博客:https://blog.csdn.net/pentiumCM/article/details/104175828

2020-02-05

OpenKE在windows环境下运行的C++动态链接库:base.dll

OpenKE是清华NLP刘知远教授团队的一个知识表示学习(knowledge graph embedding)的开源框架。官方版本仅提供linux环境下的包。如何需要在windows电脑下运行,需要将项目base目录下面的C++的代码进行重新编译成base.dll,然后替换项目config/Config.py中的base.so为刚刚编译的base.dll。之后项目便可在windows操作系统上面运行了。

2019-12-25

K-Means和K-Means++算法的数据集

K-Means和K-Means++算法的数据集。包含了两个特征的数据集,分别为XOY坐标轴中的X坐标和Y坐标。不带有类别标签。

2019-12-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除