![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
小吴同学GOGOGO
一只怀揣梦想的阿柴;五角场某高校同学、某大厂打工人;兴趣方向:OLAP基础架构、大数据存储和计算引擎;「计算机小屋」
展开
-
决策树的剪枝-“成本复杂度”函数
知识点源自李航-《统计学习方法》1、决策树的剪枝;在决策树学习算法的过程中,为了尽可能正确分类训练样本,结点划分过程将不断重复,有时会造成决策树分支过多,这时就可能因为训练样本学得“太好”了,以至于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合。所以我们采用剪枝对其进行处理。2、剪枝通过什么方法:通过极小化决策树整体的损失函数来实现。假设有如下几个变量:**设决策树 T 的叶子节点个数为 ∣ T ∣ ,t 是树 T 的叶子节点,该叶节点有 N t 个样本点,其中k 类的样本点有N原创 2020-10-26 10:33:15 · 1312 阅读 · 0 评论 -
Git提交修改内容并获取修改日志
如果修改了文件夹当中的一个文件然后查看当前的文件和修改之前有什么不同:使用:git diff 文件名来进行查看提交修改:git add 文件名然后提交:git commit -m “注释”利用git status 来查看当前git里面的状态同时可以使用git log来查看该文件历史的修改记录。...原创 2020-08-21 13:31:46 · 429 阅读 · 0 评论 -
git - 创建版本库
创建版本库打开安装之后出现的这个git bash.创建版本库:首先在合适的地方创建一个空目录mkdir learngitcd learngitpwd打印出当前的空目录然后利用git init 来讲当前的目录变成可以管理的仓库。当然是空的仓库(empty Git repository)把文件添加到版本库首先编写一个txt文件(不要用win的记事本),加入命名为readme.txt.然后写入内容。将其放入learngit的目录下。然后将该文件放入仓库中:1:git add r原创 2020-08-21 01:25:41 · 140 阅读 · 0 评论 -
Git的下载镜像地址(解决官网下载龟速的问题-建议收藏)
点击这里-开始您的欢快下载之旅-哈哈原创 2020-08-20 18:25:17 · 232 阅读 · 0 评论 -
Windows底下安装Anoconda,搭建tensorflow和openCV环境详细过程
以最短的语言简述Windows底下安装Anoconda,搭建tensorflow和openCV环境详细的过程:安装Anoconda下载网址:https://www.anaconda.com/products/individual选择自己电脑系统,然后下载对应的版本,下载完成后,直接双击安装,按照自己需要默认点击即可;配置tensorflow和openCV;安装完成之后,打开navigator;选择environment;安装tensorflow和openCV在搜索框下载即可。..原创 2020-08-12 22:50:28 · 216 阅读 · 0 评论 -
详解机器学习的决策树算法(DT)-以及划分数据集的ID3算法
1:什么是决策树顾名思义:决策树就是根据已有的条件进行决策从而产生的一棵树。比如,这就是一颗决策树,根据不同的取值决定不同的走向2、那么如何根据现有的属性来决定谁是第一个节点,谁是第二个节点呢,这里就要用到ID3算法了Id3 算法大家可以搜一下,就是利用信息熵来计算的,根据信息增益每次找到最合适的来当树根,这样,就会更符合实际情况3、有了建树的方法,接下来就是进行建树,建树是递归建立的...原创 2020-03-28 19:03:41 · 1041 阅读 · 0 评论 -
机器学习项目-利用K-近邻算法实现手写数字的识别
相信稍微了解过机器学习的都应该知道k近邻算法,如果不是很了解的,可以看我上一次的博客,或者搜一下也可以。这一次就是利用k-近邻算法实现手写数字的识别。首先准备训练数据和测试数据:我的博客里面有这两个数据。将图像数据:打开文件:将3232的图像转为11024的向量:def img2vector(filename): returnVect = zeros((1,1024)) ...原创 2020-03-28 12:59:29 · 614 阅读 · 0 评论 -
浅谈机器学习的K-近邻算法
机器学习的K-近邻算法是一种监督学习的方法,是一种分类算法,其主要思想是:如果一个样本在特征空间中的k个最邻近的样本中的大多数属于某一个类别,则该样本也划分为这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。那么一般的将临近的几个样本数量设为k,那么k对结果的影响也很大。def createDateSet(...原创 2020-03-11 20:14:53 · 142 阅读 · 0 评论