自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 GBDT理解2.0

参考文献1.GBDT原理与Sklearn源码分析-回归篇2.GBDT原理与Sklearn源码分析-分类篇3.GBDT原理与实践-多分类篇前提:CART可以用于回归和分类,那么到底用回归还是分类呢?我们知道,GBDT拟合的目标是一个梯度值,这个值当然是一个连续值或者说实值,所以在GBDT里,通通都是回归树!!!如果损失函数选的是最小平方损失函数,那么拟合残差就和拟合损失函数的负梯度是等...

2019-07-26 14:34:36 189

原创 机器学习项目总流程

总流程框架:观察大局;获得数据;从数据探索和可视化中获得洞见;机器学习算法的数据准备;选择和训练模型;微调模型;展示解决方案;启动、监控和维护系统;一. 观察大局(相当于前期分析论证)用商业术语定义目标,就是目标具体明确化;明确这里要设计的方案在总体方案中所处的位置,即是哪一环节?当前已经有的解决方案是什么?效果怎么样?问题是什么?我们要设计的方案架构是什么?有/无...

2019-07-29 09:45:14 141

原创 BM、RBM、DBN思路

2019-07-24 23:23:42 525

原创 Leetcode刷题收集

1.s.substr(pos, n)#一种构造string的方法2.unordered_map<char, int> m{{‘I’, 1}, {‘V’, 5}, {‘X’, 10}, {‘L’, 50}, {‘C’, 100}, {‘D’, 500}, {‘M’, 1000}};构造字典3.erase函数#一种删除vector中指定元素的方法4.产生指定范围内的随机数...

2019-07-22 11:05:44 107

原创 【刷题】刷题常用STL函数整理合集

本文归纳总结刷题常用到STL容器以及一些标准算法,主要包括:part1.序列容器stringvectorqueuedequestackpart2.关联容器setmapunordered_map以及这些容器的常用操作:如插入、删除、查找、访问方式(迭代器or下标,C++11关键字auto了解吗?顺序访问or随机访问)、初始化等。一、序列容器常用容器: vector、d...

2019-07-15 23:26:49 4178 1

原创 关于CTR方法的发展过程

https://blog.csdn.net/lilyth_lilyth/article/details/48032119https://blog.csdn.net/lovejay7/article/details/81878537https://blog.csdn.net/muyimo/article/details/82834604https://zhuanlan.zhihu.com/p/...

2019-07-15 23:02:39 779

原创 CTR的模型:FM、FFM和DeepFM的理解

参考文献1.FM系列算法解读(FM+FFM+DeepFM)2.深入FM和FFM原理与实践3.CTR学习笔记系列—— FM 和 FFM4.FM算法及FFM算法5.『我爱机器学习』FM、FFM与DeepFM6.CTR预估算法之FM, FFM, DeepFM及实践前言在计算广告中,CTR是非常重要的一环。对于特征组合来说,业界通用的做法主要有两大类:FM系列和Tree系列。这里我们来介...

2019-07-11 11:45:08 4776

转载 【转载】训练集(train)、验证集(validation)和测试集(test)

转载文献地址1转载文献地址2在有监督的机器学习中,经常会说到训练集(train)、验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别。划分如果我们自己已经有了一个大的标注数据集,想要完成一个有监督模型的测试,那么通常使用均匀随机抽样的方式,将数据集划分为训练集、验证集、测试集,这三个集合不能有交集,常见的比例...

2019-07-08 15:07:47 825

原创 二叉树遍历(前序中序后序递归迭代共6种)

总体把握:层次遍历使用 BFS 实现,利用的就是 BFS 一层一层遍历的特性;而前序、中序、后序遍历利用了 DFS 实现。前序、中序、后序遍只是在对节点访问的顺序有一点不同,其它都相同。1.前序遍历#递归版本void dfs(TreeNode root){ visit(root); dfs(root->left); dfs(root->right);}#迭代...

2019-07-08 00:04:32 559

转载 【转载】GBDT示例

1.GBDT实例介绍2.GBDT一个例子3.GBDT几问

2019-07-02 17:35:05 887

原创 手推收集整理

一.第三章线性模型1.最小二乘法(随机梯度下降法和牛顿法的比较)2.为什么当两类数据同先验、满足高斯分布且协方差相等时,LDA可达到最优分类3.为什么作为分类算法的LDA可以视为降维手段,而且是有监督的,并且与PCA相提并论?因为当LDA推广到多分类问题时,W的闭式解是 Sw-1Sb 的 N-1 个最大广义特征值所对应的特征向量组成的矩阵。若将W视为一个投影矩阵,则多分类LDA将样本投影...

2019-07-01 22:14:33 305

微博图片爬取工具

自动爬取指定用户图片,只需将微博用户的链接输入分析中即可

2017-08-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除