- 博客(10)
- 收藏
- 关注
原创 TASK3 XGB算法梳理
1 算法原理XGBoost(eXtreme Gradient Boosting)是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。XGBoost是对GBDT算法的一种改良实现,主要包括了正则化、损失函数、学习策略、并行实现等方面。GBDT中预测值是由所有弱分类器上的预测结果加权求和,其中每个样本上的预测结果是样本所在的...
2019-04-08 22:45:47 230
原创 TASK2 GBDT算法梳理
1 前向分布算法这样,前向分布算法将同时求解从m=1到M的所有参数βm, rm的优化问题简化为逐次求解各个βm, rm的优化问题。2负梯度拟合GBDT在函数空间中利用梯度下降法进行优化。在GBDT的迭代中,假设前一轮迭代得到的强学习器是ft-1(x)损失函数是L(y,ft-1(x)) 。本轮迭代的目标是找到一个CART回归树模型的弱学习器ht(x),让本轮的损失L(t,ft-1(x)+ht...
2019-04-07 19:47:07 210
原创 TASK1 随机森林算法梳理
1 集成学习概念集成学习是训练多个个体学习器(常为弱分类器),根据一定的结合策略形成一个强监督模型,其思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来。集成学习可用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等。根据个体学习器的生成方式分为:个体学习器间存在强依赖关系、必须串行生成的序列方法。如:Boosting个体学习器间不存在强依赖关系、可同...
2019-04-04 18:15:05 212
转载 任务七 0-1背包问题实现和分割回文串 II (132)
0-1背包问题实现描述:有n种物品与承重为m的背包。每种物品只有一件,每个物品都有对应的重量weight[i]与价值value[i],求解如何装包使得价值最大。思路:参考https://mp.weixin.qq.com/s/Lo06M_jcGf7ZYm6YH2s7aw 可知,选择策略有三种:最小重量、最大价值和最大价值密度,本题选择最大价值密度,即S i=value i/weight i。...
2018-12-24 20:18:26 158
原创 任务六 电话号码的字母组合和全排列 python解法
题目1 电话号码的字母组合(17)给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。代码:# 递归思想class Solution(object): def letterCombinations(self, digits): """ :type digits: s...
2018-12-23 16:08:32 195
原创 任务四 递归思想和动态规划
递归思想相对于迭代,递归不需要维护许多变量,其过程更容易理解,也更容易实现。但要注意为递归函数编写终止条件,否则将产生无限递归。一般递归求解问题需满足的条件:(1)把要解决的问题转化为一个子问题,这个子问题规模更小、具有与原来问题相同解法。(2)原问题可以通过子问题解决而组合解决。(3)存在一种简单的情境,是问题在简单情境下退出。例子:斐波拉契数列问题一个数列满足 1,1,2,3,5...
2018-12-22 17:19:18 209
原创 任务一 哈希表思想
哈希表思想:哈希表,又名散列表,是key-value类型的数据结构,通过关键码值直接进行访问。通过散列函数进行键和数组的下标映射从而决定该键值应该放在哪个位置,哈希表可以理解为一个键值需要按一定规则存放的数组,而哈希函数就是这个规则。算法中时间和空间是不能兼得的,哈希表就是一种用合理的时间消耗去减少大量空间消耗的操作,这取决于具体的功能要求。用散列查找分为两步:1.用散列函数将被查找的键转换...
2018-12-21 20:31:30 276
原创 任务四 双叉树的遍历
二叉树:树是一种数据结构,它是由n(n>=1)个有限结点组成一个具有层次关系的集合。特点:(1)每个结点有零个或多个子结点(2)没有父节点的结点称为根节点(3)每一个非根结点有且只有一个父节点(4)除了根结点外,每个子结点可以分为多个不相交的子树。二叉树是每个结点最多有两个子树的树结构。它有五种基本形态:二叉树可以是空集;根可以有空的左子树或右子树;或者左、右子树皆为空。特点...
2018-12-21 20:28:40 313
转载 任务三 队排列和堆排列思想
1 基础知识队排列思想:队列(queue)是一种具有先进先出特征的线性数据结构,元素的增加只能在一端进行,元素的删除只能在另一端进行。能够增加元素的队列一端称为队尾,可以删除元素的队列一端则称为队首。“它的跟踪原理类似于在超市收银处排队,队列里的的第一个人首先接受服务,新的元素通过入队的方式添加到队列的末尾,而出队就是将队列的头元素删除。”堆排序思想堆排序是利用堆进行排序的,堆是一种完全...
2018-12-20 17:20:28 167
原创 任务二 链表学习、环形链表、反转单链表
哈希表思想与python实现俩数和、快乐数哈希表思想哈希表,又名散列表,是key-value类型的数据结构,通过关键码值直接进行访问。通过散列函数进行键和数组的下标映射从而决定该键值应该放在哪个位置,哈希表可以理解为一个键值需要按一定规则存放的数组,而哈希函数就是这个规则。算法中时间和空间是不能兼得的,哈希表就是一种用合理的时间消耗去减少大量空间消耗的操作,这取决于具体的功能要求。用散列查找...
2018-12-18 17:13:08 235
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人