自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

GeekDengshuo

学习记录

  • 博客(10)
  • 收藏
  • 关注

原创 第四章 决策树

决策树 Decision Tree一.基础知识树的基本类型: 结点(内部节点,叶结点)+有向边 决策树也叫判断树,树的结构是满足 if-then 条件规则的. 树的特点:可读性性高,分类速度快二.思想脉络决策树=从训练数据集中归纳出一组分类规则(模型)+以损失函数为目标函数的最小化(策略)+递归的选择最优特征(算法)三.算法推导决策树的生成特征选择(...

2018-05-30 15:05:28 226

原创 第三章 K 近邻法 (kNN 以及kd-tree)

k近邻法基础知识1 模型使用的模型实际上对应于特征空间的划分.模型的三个基本要素:距离度量 , k值的选择 , 分类决策规则决定.思想脉络1 方法的流程简述给定一个训练数据集,对于新的输入实例,在训练数据集中找到与之最临近的k个实例,这k个实例的多数属于某个类, 就把实例分为这个类.这个算法没有显示的训练过程,应用的过程就是训练的过程算法推...

2018-05-29 14:32:22 550

原创 第一章 机器学习方法概论

机器学习方法概论基础知识1 机器学习三要素构建一个机器学习方法就是确定具体机器学习三要素的过程机器学习方法=模型+策略+算法模型:就是所要学习的条件概率分布或决策函数策略:模型的假设空间包括所有可能的条件概率分布和决策函数,按照什么样的准则学习或选择最优模型. 也就是在假设空间中如何选择最优模型就是策略.算法:算法就是指学习模型的具体计算方法....

2018-05-22 10:38:31 232

原创 第九章 聚类 Clustering

第九章 聚类(Unsupervised Learning)无监督学习:     训练样本的标记信息是未知的,通过对无标记数据的训练来找出数据内部所存在的规律以及性质.为进一步的数据分析打下基础1.知识点聚类过程中会自动的形成簇结构,但是算法对簇(cluster)没有概念,这是在运算过程中自己出现的聚类现象,这个簇的名字需要自己来进行定义聚类可作为一个单独的过程来完成,用于去寻...

2018-05-16 16:12:27 286

原创 第八章 Ensemble_learning

Ensemble learning根据集成学习的生成方式,集成学习可分成两大类:Boosting:个体间存在强依赖关系,必须串行生成的序列化方法 Bagging&Randon Forest: 个体间学习器不存在强依赖关系,可以同时生成的并行化方法loss function(损失函数) 以及 cost function(代价函数)的区别 定义# 如何使用集成学习fro...

2018-05-15 10:43:11 334

原创 第七章 贝叶斯分类器的推导及实现

贝叶斯分类器1.基本的概率论知识先验概率:由以往的数据得到的后验概率:得到信息后再重新加以修正的概率 R(ci∣x)=∑j=1NλijP(cj∣x)R(ci∣x)=∑j=1NλijP(cj∣x)R(c_i\mid \textbf x)=\sum_{j=1}^N \lambda_{ij} P(c_j\mid \textbf x)对于每个样本 xx\text...

2018-05-07 15:41:07 1190

原创 Linux学习(不定期更新~)

1.基本命令echo 显示一行文本   echo+要输出的文本, echo 有“显示,打印出”的意思 clear   清理显示器界面  history 显示之前敲的代码 tab     补全命令键,会检测到文件目录下的相匹配的文件名并自动补全。unbutu 的磁盘清理:sudo apt-get clean 清理apt下载安装软件是的缓存文件sudo apt-ge...

2018-05-04 20:23:37 168

原创 Gits学习(不定期更新~)

学习的时候要注意自己的学习目的是什么?不要想成为一个”软件工具”方面的专家,因为有的指令可能一辈子都用不到,既然是一个工具 那就没有必要把时间浪费在那些”高级”但几乎永远不会用上的指令上,就算可能会用到,自行google就行Git:世界上最先进的分布式版本控制系统1.创建版本库 :repositorymkdir 创建一个文件夹 cd到文件下 git init ...

2018-05-04 20:18:19 1618

原创 Python 学习笔记(不定期更新~)

Python基础知识python的优势Python中的for循环要高于C语言中的for循环,因为Python中的for循环不仅可以用在list或tuple上 还可以用在其他的可迭代对象上. python 实现下标循环,利用Python内置的enumerate函数可以把一个list变成索引-元素对.这样就可以在for循环中同时迭代索引和元素本身. such as : for ...

2018-05-04 20:09:51 329

原创 第一章 数据结构与算法

第一章 数据结构与算法常用的数据结构应该直接用另外有趣的一点是,collections模块中包含比较多针对数据结构的解决方案努力成为一名合格的调包侠1.1 可迭代对象的分解元素# 可迭代对象中分解元素(找到自己的需求元素)# 解决方案,利用"*表达式"def drop_first_last(grades): first,*middle,last=grades...

2018-05-01 18:05:14 191

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除