自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 《统计学习方法》笔记--提升方法

基本思路  提升方法是通过改变训练样本的权重,得到一系列弱分类器(基本分类器),然后通过组合这些弱分类器,构成一个强分类器。AdaBoost在每一轮如何改变训练数据的权值或概率分布?提高那些被前一轮弱分类器错误分类样本的权值,而降低那些被正确分类样本的权值。AdaBoost如何将弱分类器组合成一个强分类器?采取加权多数表决的方法,具体地,加大分类误差率小的弱分类器的权值,使其在表决中起较大的作用,减小分类误差率大的弱分类器的权值,使其在表决中起到较小的作用。AdaBoost算法  假设给定

2022-01-19 10:59:44 928

原创 《统计学习方法》笔记--CART算法

  分类与回归树(classification and regression tree, CART),既可以用于分类也可以用于回归。它是在给定输入随机变量XXX条件下输出随机变量YYY的条件概率分布的学习方法。CART 假设决策树时二叉树,内部结点特征的取值为“是”和“否,左分支是取值为“是”的分支,右分支为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间(特征空间)划分为有限个单元,并在这些单元上确定预测的概率分布,也就是给定条件下输出的条件概率分布。  CART算法由以下两步组成:决

2021-12-24 19:37:36 511

原创 windows关于python环境的操作

退出python 环境 输入exit()或者 ctrl+z+回车键查看conda有哪些虚拟环境 conda info -e激活\退出conda环境  conda activate 环境名称  conda deactivate

2021-12-21 14:40:57 487

原创 《机器学习》笔记---随机森林

Bagging   Bagging基于自助采样法,给定包含m个样本的数据集,我们先随机取出一个样本放入采样集中,再把该样本放回初始数据集中,使得下次采样仍肯能被选中,这样经过m次操作,我们得到m个样本的采样集,照这样,我们可采样出T个含m个训练样本的采样集,然后基于每个采样集训练一个基学习器,再将这些学习器进行结合。  在对预测输出进行结合时,Bagging通常对分类任务使用简单投票法,对回归任务使用简单平均法。随机森林 RF  RF是以决策树为基学习器构建Bagging集成的基础上,进一步在决策

2021-12-20 17:59:52 832

原创 《大话数据结构笔记》--堆排序

堆是具有如下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆(如9-7-2左图所示);或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆(如9-7-2右图所示)深度为k的满二叉树的结点数n<2k−1n < 2^k -1n<2k−1, 如果对一课有n个结点的完全二叉树的结点按层序编号,对于任意结点i(1<=i<=n)i(1<= i <= n)i(1<=i<=n),有如下:如果i=1i=1i=1,则结点iii是二叉树的

2020-06-05 15:55:32 166

原创 pip 设置国内镜像,提升速度

国内镜像列表:阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 htt...

2020-04-29 18:52:13 123

原创 安装包时 报错pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted

解决方法:延迟时间检测pip --default-timeout=1000 install 模块名

2020-04-29 16:43:13 373

原创 git本地代码推送到远程 fatal: refusing to merge unrelated histories

本地的建立了一个项目,在已完成部分代码的情况下,想推送到远程,于是在远程对应建了项目名称,但在提交时,报如下错:get到github初始化项目时新建了readme文件,应该pull下,但还是报错主要是在pull是远程认为本地项目与远程对应的不相关,执行:git pull origin master --allow-unrelated-histories 强制认为相关就OK了...

2020-04-28 17:38:35 121

原创 《大话数据结构》笔记-赫夫曼树

从树中一个结点到另一个结点之间的分支构成两个结点之间的路径,路径上的分支数目称为路径长度。下图中,根结点到结点D的路径长度为4。*根的路径长度是从树根到每个结点的路径长度之和。*下图树路径长度为1+1+2+2+3+3+4+4=20赫夫曼定义:假设有n个权值{w1,w2,...,wn}\{w_1, w_2, ..., w_n\}{w1​,w2​,...,wn​}, 构造一棵有nnn个叶子结点的二...

2020-04-27 16:37:18 159

原创 朴素贝叶斯法

前言贝叶斯定理阐述了两个随机事件之间的关系:p(A∣B)=p(B∣A)p(A)p(B)p(A|B) = \frac{p(B|A)p(A)}{p(B)}p(A∣B)=p(B)p(B∣A)p(A)​朴素贝叶斯法是基于贝叶斯定理和特征独立性假设的分类方法。对于给定的训练数据,首先基于特征独立性假设学习输入输出的联合概率分布,然后基于此模型,对于给定的输入xxx,利用贝叶斯定理求出后验概率最大的输出...

2020-04-24 16:42:23 160

原创 《大话数据结构》笔记--树、森林与二叉树的转换

树转换为二叉树步骤如下:加线。在所有兄弟结点之间加一条线去线。对树中每个结点,只保留它与第一个孩子结点的连线,删除它与其他孩子结点之间的连线层次调整。以树的根结点为轴心,将整棵树顺时针旋转一定的角度,使之结构层次分明。此时第一个孩子是二叉树的左孩子,兄弟转换过来的孩子是结点的右孩子森林转换为二叉树森林由若干棵树组成,所以可以理解为,森林中的每一棵树都是兄弟可以按照兄弟的处理办法,...

2020-04-24 11:42:57 167

原创 《大话数据结构》笔记--线索二叉树

利用二叉链表的空地址,存放指向结点在某种遍历下(不同的遍历方法,前驱和后继不同)的前驱和后继的地址,我们把这种指向前驱和后继的指针称为线索,加上线索的二叉链表称为线索链表,相应的二叉树称为线索二叉树线索化的过程我们对二叉树以某种次序遍历使其变为线索二叉树的过程称做是线索化对于如下的二叉链表我们把这棵二叉树进行中序遍历时,得到字符序列: HDIBJEAFCG ,如下图,将上图所有的空指针域...

2020-04-24 10:56:34 223

原创 最优化方法

参考:《机器学习》-雷明https://blog.csdn.net/THmen/article/details/87366904最优化方法,即寻找函数极值点的数值方法。通常采用的迭代法,它从一个初始点x0x_0x0​开始,反复使用某种规则(一阶导数即梯度或者二阶导数信息即Hessian矩阵)从xkx_kxk​到下一个点xk+1x_{k+1}xk+1​,直到到达函数的极值点。最优化问题可...

2020-04-23 14:28:21 1487

原创 《大话数据结构》-根据遍历结果反推二叉树

了解二叉树几种遍历方法,可参考二叉树遍历根绝二叉树的遍历性质,可以得到两个性质:1. 已知前序和中序遍历序列,可以唯一确定一棵二叉树2. 已知后序和中序遍历序列,可以唯一确定一棵二叉树3. 已知前序和后序遍历序列,无法确定一棵二叉树例题1:已知一棵二叉树的前序遍历序列为ABCDEF,中序遍历序列为CBAEDF,请问这棵二叉树的后序遍历结果是多少?分析: 首先确定根结点,再分别确定左子树...

2020-04-23 11:14:46 695

原创 《大话数据结构》--遍历二叉树、树和森林

二叉树的遍历:是指从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。二叉树的遍历方法前序遍历先访问根结点,然后前序遍历左子树,再前序遍历右子树,如下图,遍历的顺序为:ABDGHCEIF总结:从上而下依次访问左子树,对于右子树比如下图中的H,I, F可以认为越靠左越优先中序遍历从最后一层的左边根结点开始(并不是先访问根结点),先遍历根结点的左子树...

2020-04-23 10:22:53 174

原创 《大话数据结构》笔记-二叉树的存储结构

文章目录顺序存储结构二叉链表顺序存储结构可以用一维数组存储二叉树中的结点,并且结点的存储位置也就是数组的下标能体现结点之间的逻辑关系。如下图的完全二叉树:将这棵完全二叉树存入数组中,相应下标对应其同样的位置对于一般的二叉树,可以按照完全二叉树编号,把不存在的结点设置为"^",如下图(浅色结点表示不存在)这种方式对浪费存储空间,所以,顺序存储结构一般只用于完全二叉树二叉链表二叉树...

2020-04-22 11:19:27 127

原创 《大话数据结构笔记》--二叉树的定义及性质

定义 : 二叉树是n(n>=0)个结点的有限集合,该集合或者为空集合(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成二叉树特点每个结点最多有两棵子树,所以二叉树不存在度大于2的结点左子树和右子树是有顺序的,次序不能任意颠倒即使树中某结点只有一棵子树,也要区分它为左子树还是右子树二叉树的5种基本形态空二叉树只有一个根结点根结点...

2020-04-22 10:56:10 737

原创 机器学习-数学知识(一)

参考:《机器学习与应用》文章目录微积分与线性代数导数向量与矩阵向量代数余子式伴随矩阵偏导数与梯度雅克比矩阵Hessian矩阵泰勒展开行列式特征值与特征向量奇异值分解向量与矩阵求导微积分与线性代数导数导数定义为函数的自变量变化值趋向于0时,函数的变化量与自变量的变化量比值的极限,即如果上面的极限存在,则称函数在该点处可导。导数的几何意义是函数在某一点处的切线的斜率,物理意义是瞬时速度。各...

2020-04-21 18:14:39 1018

原创 《大话数据结构》笔记--树

文章目录树的相关定义度深度(高度)树的存储结构双亲表示法树的相关定义定义:树是n(n>=0)个结点的有限集。n=0称为空树。在任意一颗非空树中:1)有且仅有一个特定的称为根的结点2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1,T2,...,TmT_1, T_2, ..., T_mT1​,T2​,...,Tm​, 其中每一个集合本身又是一颗树,并称为根的子...

2020-04-20 15:22:04 336

原创 多数元素

“”"题目:给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的,并且给定的数组总是存在多数元素。示例 1:输入: [3,2,3]输出: 3“”"def majority_element(nums) -> int: """ # hash表计数解法 :param nums: ...

2020-04-19 16:22:04 97

原创 排序算法(一)

冒泡排序让数组当中相邻的两个元素进行比较,数组当中较小的元素向下沉,较大的元素向上浮.采用两个for循环,外层for循环控制循环次数,内层for循环控制两个相邻元素进行比较.比如:对数组[10, 1, 35, 61, 89, 36, 55]排序第一次排序:10与1比较,1上浮,10下沉,数组变为[1, 10, 35, 61, 89, 36, 55]第2个元素10再与35比较,保持不动第3...

2019-11-19 17:29:22 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除