自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 数据挖掘十大算法---KNN

KNN就是 通过计算测试样本与已经标注好的每个训练样本的距离,获取前K个距离最近的“邻居”样本,通过简单投票法或者加权投票法对所有“邻居”的类别统计,返回计数最多的类别为测试样本的类别。 KNN算法本身是比较简单的!其实机器学习的难点在于: 1、数学建模:就是把原始资料的特征转换为计算机可以识别的向量的过程 2、选取适合数据的模型 KNN算法的缺点: 1、训练样本不平衡容易导致结果错误 ...

2020-03-25 10:31:37 186

原创 数据挖掘十大算法---朴素贝叶斯

一、介绍 朴素贝叶斯:基于贝叶斯定理与特征条件独立假设的分类方法 优点:原理和实现都比较简单; 对小规模的数据表现很好,能处理多分类任务; 对缺失数据不太敏感,常用与文本分类。 缺点: 假设属性之间相互独立,这个假设在实际应用中往往是不成立的; 在属性个数比较多或者属性之间相关...

2020-03-24 19:25:36 430 1

原创 数据挖掘十大算法--PageRank

RageRank--网页排名 将网页想象为一张有向图 将节点的关系转换为表格,以列的每个元素为基本点,对角线为0(自己到自己为0),看第一列,A->B、C、D,存在指向边,则为1;第二列B->A、C有指向边为1,到D没有指向边为0。以此类推填充表格。 A B C D A(出链) 0 1 1 1 B(出链) 1 ...

2020-03-11 14:14:53 343

原创 数据结构与算法Python--(二)算法分析

def method1(w_1,w_2): alist = list(w_2) print(alist) pos1 = 0 OK = True while pos1 < len(w_1) and OK: pos2 = 0 found = False while ...

2020-03-08 10:55:50 214

原创 深度学习--大锅菜

tf.device() 指定tensorflow运行的GPU或CPU设备 tf.name.scope() 相当于 将定义的几个变量 放到一个“文件夹” 中。里面的参数就会“文件夹”的名字。 tf.Variable()用于生产一个初始值为initial_value的变量,必须指定初始化值。 tf.get_variable()可获取已存在的变量也可创建一个不存在的变量,必须有名字,并且定义...

2020-03-07 21:40:19 181

原创 数据结构与算法(Python)笔记--概述

104 算法和计算复杂度 107 为什么研究数据结构

2020-03-03 10:17:57 145

原创 数据挖掘十大算法---C4.5

一、介绍 (1)基本概念 ①决策树:基于特征属性不断向下划分,对数据进行分类。决策树算法包括ID3、C4.5、CART。 ②信息熵:由香农提出,被用来作为一个系统的信息含量的量化指标。一个特征发生的概率越小(概率小的事情发生了,更会引人注目哇),用于划分数据的效果越显著(所含的信息量越大)。 ③条件熵:在给定的X条件下,随机变量Y的不确定性(条件熵中的X也是一个变量...

2020-03-02 17:27:36 193

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除